岗位职责
1、负责公司软件平台的日常基建开发,保障平台稳定、高效运行。
2、负责容器化平台的搭建和维护,使用 Kubernetes 进行容器编排和管理。
3、负责设计、搭建、维护、优化可观测性系统,包括监控、告警、日志等,提供高效的日志收集、存储、分析和查询能力,实现对平台运行状态的全面掌控。
4、负责自动化运维工具和平台的开发。
5、负责编写和维护基建文档,包括操作手册、故障处理指南等,处理平台故障,进行问题排查和解决,并总结经验教训。
岗位要求
1、研究生及以上学历,计算机相关专业优先。
2、具备运维工作3年以上工作经验,有云平台(AWS、Azure、GCP 等)、微服务架构运维经验优先。
2、熟悉 Linux 操作系统,具备扎实的 Shell/Python 脚本编写能力。
3、熟悉 Kubernetes 容器编排技术,具备丰富的实践经验。
4、熟悉 Prometheus、Grafana 等监控工具,具备可观测性系统搭建和维护经验。
5、熟悉 ELK/EFK 等日志系统,具备日志收集、分析和查询的实战经验。
6、熟悉常用的运维工具和技术,例如 Ansible、Jenkins、Git 等。
7、具备良好的问题分析和解决能力,能够独立处理复杂问题。
8、具备良好的沟通能力和团队合作精神,责任心强。