岗位职责:
1.应用系统运维保障:
负责公司业务应用系统(Web/API/微服务)的日常部署、监控、维护与优化
建立并完善应用监控体系(业务指标、性能指标、错误率等)
2.故障应急响应:
快速定位并解决线上应用故障,主导故障复盘与改进
设计并实施高可用架构方案,包括负载均衡、容灾切换等
3.数据库运维支持:
负责MySQL/Redis等数据库的日常维护、备份恢复、性能优化
4.自动化与工具开发:
编写运维脚本(Shell/Python)实现日常操作自动化
开发运维工具平台,提升部署效率和监控能力
参与CI/CD流水线建设,推动DevOps实践落地
1.应用运维经验:
熟悉云服务和平台(AWS);
03年以上应用系统运维经验,熟悉操作系统(如Windows Server、Linux)的管理和维护;
精通Nginx/Tomcat/Docker/redis/zookeeper/MQ等等中间件的部署和调优
至少熟练掌握一种脚本语言(如Python、Shel等);
掌握应用性能监控工具(如APM、Prometheus.Grafana)
熟悉网络协议和技术(如TCP/IP、DNS、DHCP),帮助日常排错;
熟悉Haproxy、LVS、DNS、Nginx、MySql、RedisZookeeper、MQ、Kafka、Prometheus、skywalking.ELK等主流开源软件技术及相关高可用架构
了解主流的编程语言(如Java、Python等);
2.排障能力:
能独立分析应用日志,快速定位问题根医
熟悉全链路排查方法(从前端到数据库)
掌握常用诊断工具(tcpdump、strace、jstack等)
3.数据库能力:
了解数据库高可用方案(主从复制、读写分离)
4.开发/脚本能力:
熟练使用Shell/Python编写运维脚本
熟悉至少一种后端开发语言(Java/Go/Python)
了解Restful API设计和开发
5.智能化运维接触:
了解机器学习基础知识,有AIOps相关项目经验者优先
了解数据库高可用方案(主从复制、读写分离)
软技能要求:
具备良好的沟通协调能力,能与开发、测试、产品团队高效协作,有强烈的责任心和主动性,能承受一定的工作压力
具备持续学习能力,关注运维技术发展趋势
有较好的文档编写习惯和知识分享意识