1.系统维护与监控:负责服务器、网络设备及相关基础设施的日常运维,保障系统的稳定运行;持续优化监控体系,实时跟踪系统性能指标,及时发现并解决潜在问题。
2.故障响应与处理:快速定位并解决系统故障,制定故障应急预案,确保业务连续性;定期分析故障原因,推动系统性优化方案的实施。
3.架构优化与支持:参与产品架构设计与优化,从运维视角提出可行性建议;协助开发团队完成代码部署、发布及回滚,确保系统平滑升级。
4.技术协作与文档:与开发、测试团队紧密协作,提供技术支持;编写规范的运维文档、操作手册及应急预案,沉淀知识资产。
岗位要求:
1.学历与经验:计算机、通信或相关专业本科及以上学历,3年以上运维相关经验。有IT行业,政务行业运维经验者优先。
2.熟练掌握Linux/Windows系统操作,熟悉常用命令及内核参数配置。
3.熟悉Zabbix、Prometheus、Grafana等监控工具,具备故障快速定位能力。
4.熟练掌握 Shell、Python 或 Go 等至少一门脚本 / 编程语言,具备自动化工具开发能力。
熟悉TCP/IP、HTTP等网络协议,具备网络问题排查能力。
5.具备安全意识,熟悉防火墙、漏洞扫描、权限管理等安全运维实践。
6.责任心强,具备良好的抗压能力及应急响应意识。优秀的沟通能力和团队协作精神,推动跨部门协作。较强的学习能力和技术文档撰写能力。
加分项:
熟悉Ansible、Terraform、Jenkins、K8S等自动化运维工具。了解ELK日志分析体系。
持有相关资格证书(软考证书、计算机等级证书等)。