工作职责:
1.、搭建与优化 CI/CD 流水线,实现前端与后端服务的持续集成与交付,加速研发迭代效率;
2、协助开发团队进行环境搭建、问题排查与性能调优,形成跨部门闭环支持;
3、设计并维护系统监控、日志采集与告警机制,确保服务性能、资源利用率与故障响应的及时性;
4、参与平台架构优化,提出运维层面的改进建议,提升系统可扩展性与自动化程度;
5、编写并维护相关技术文档,包括运维手册、部署指南、应急预案等,推动运维体系标准化与自动化;
6、参与监控体系建设、信息安全体系建设和DevOps工具链开发。
任职要求:
1、本科及以上学历,5年以上DevOps/SRE工作经验;
2、深入理解Docker及K8S,Kubernetes使用经验超过3年,Jenkins+Pipeline ClCD运维经验超过3年;
3、熟练运用Linux常用命令,2年以上Python开发经验,具备较为成熟的工程思想,掌握常用的设计模式,熟练运用常用的正则表达式;
4、有阿里云使用经验、熟悉Linux常见发行版(CentOS6/7、Ubuntu Server、Alpine),熟悉Prometheus/Grafana/APM等监控工具,能够进行相关配置和数据分析;
5、能独立排查文件系统、网络、负载过高等故障,熟练使用strace、vmstat、top、iftop、iotop等工具;
6、有容灾备份工程和一定的攻防实战经验,能够独立完成数据恢复工作,与团队共同完成信息安全体系建设工作;
7、有较强的自驱力,对技术有热情,学习能力强,适应能力好,沟通能力强,有一定的抗压能力。