职位描述
岗位职责:一、岗位职责
核心工作内容
系统运维保障:负责服务器、网络设备、存储设备等基础设施的日常维护和管理,确保系统7×24小时稳定运行
故障处理与应急响应:快速定位并解决系统故障,进行问题诊断和恢复操作,编写故障处理报告
性能优化与监控:持续监控系统运行状态,进行性能调优和容量规划,保障系统高可用性
自动化运维:开发自动化运维工具和脚本,提升运维效率,减少重复性工作
安全防护:负责系统安全策略制定和实施,定期进行安全检查和漏洞修复
具体工作细分
负责应用系统的部署、发布、监控和维护工作
参与CI/CD流程,负责生产环境部署实施和版本发布
制定并执行高可用及容灾方案,建立健康度指标体系
编写运维手册、故障处理预案等技术文档
负责数据库的日常维护、备份恢复和性能优化
二、任职要求
学历与经验
本科及以上学历,计算机相关专业
3年以上系统运维相关工作经验
有大型互联网网站或企业级系统运维经验者优先
技术技能要求
操作系统与网络
精通Linux/Unix系统管理,熟练掌握Shell脚本编写
熟悉TCP/IP协议栈,掌握网络故障排查能力
熟悉常见网络设备(路由器、交换机、防火墙)的配置和管理
数据库与中间件
熟悉MySQL、Oracle、Redis、MongoDB等数据库的部署、运维和优化
熟悉Nginx、Tomcat、Kafka、RabbitMQ等中间件的配置和调优
容器与云平台
熟悉Docker容器化技术,具备Kubernetes(K8s)生产环境运维经验
熟悉阿里云、腾讯云、AWS等主流云平台的操作和运维
掌握Ansible、SaltStack、Puppet等配置管理工具
监控与自动化
熟悉Zabbix、Prometheus、Grafana等监控工具的使用和配置
熟悉Jenkins、GitLab CI等CI/CD工具,掌握持续集成/持续部署流程
掌握Python或Go等编程语言,能够开发自动化运维工具
三、软技能要求
沟通协调能力:能够与开发、测试、产品等团队高效协作,推动问题解决
问题解决能力:具备快速定位、分析和解决系统/网络故障的能力
学习能力:能够快速学习新技术、新工具,适应技术发展
责任心:对工作高度负责,具备主动发现和解决问题的能力
四、优先考虑条件
持有CCNA、RHCE、CKA等相关技术认证者优先
有金融、互联网、电商等行业运维经验者优先
具备百台以上服务器管理经验者优先
有DevOps或SRE实践经验者优先
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕