职位描述
一、岗位职责:
1.负责应用系统的交维审核,确保系统符合上线标准和规范要求。
2.负责应用系统的日常监控与维护,熟练使用Prometheus、Zabbix等监控工具进行性能分析和问题预警。
3.负责应用系统的故障排查与处理,及时响应并解决系统运行中的问题,编写详细的故障分析报告。
4.参与应用系统的性能优化和容量规划,提出合理化改进建议。
5.建立和完善应用系统运维制度和操作流程,提高系统稳定性和可用性。
6.协助开发团队进行生产环境的问题诊断,提供运维支持。
7.编写运维文档和技术手册,推动知识共享和传承。
二、任职资格:
1.具备良好的团队沟通和协作能力,有较强的责任心和自我驱动能力。
2.3年以上应用运维或SRE相关工作经验,熟悉Linux操作系统及常用服务配置。
3.熟悉Prometheus、Zabbix、Grafana、ELK等监控工具,能够进行监控指标配置、告警规则设置和问题分析。
4.熟悉Shell/Python编程,能够编写自动化运维脚本和工具。
5.熟悉Nginx、Tomcat、Apache、MySQL、Redis等常用应用中间件的配置、优化和故障排查。
6.了解DevOps理念,熟悉CI/CD流程,掌握Jenkins等自动化部署工具的使用。
7.熟悉网络基础知识,能够进行基本的网络故障排查。
8.有公有云平台(如阿里云、华为云、腾讯云)使用经验者优先。
9.具备良好的文档编写能力,能够编写规范的运维手册和操作指南。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕