【工作职责】:
1、精通Docker容器技术,具备自建或基于公有云的Kubernetes集群运维经验。
2、负责容器云平台的设计、研发与维护,包括基础架构规划、自动化部署、监控系统搭建、性能优化及疑难问题解决。
3、负责Linux和Windows Server系统的运维管理,完成安装配置、监控告警、故障排查及日常运维,确保服务器稳定运行。
4、参与公司 IT系统的稳定性建设工作,制定故障预防措施,组织SOP演练及应急预案实施,提升系统容灾与故障处理能力。
5. 推动运维流程自动化,通过脚本和工具开发提升运维效率,降低人工操作风险。
6. 负责网络及云平台的安全配置管理与优化,确保系统与数据的安全合规。
【任职要求】:
1、统招本科及以上学历,计算机、软件工程等相关专业,3年以上运维工作经验。
2、深入理解Linux操作系统的内核和体系结构,具备扎实的系统管理与故障排查能力。
3、精通Docker容器技术及Kubernetes集群管理,有生产环境业务支撑经验。
4、熟悉并具备Nginx、Haproxy等接入层技术方案的实际经验,能进行系统优化与高可用配置。
5、熟练使用Zabbix、Grafana、Prometheus、ELK等监控工具,能搭建并优化企业级监控体系。
6、具备CI/CD落地经验,熟悉敏捷开发流程,能有效推动开发与运维协作。
7、精通Shell、Python或其他脚本语言,能独立编写运维自动化脚本。
8、熟悉网络架构与云平台安全管理,能够主动预防安全风险,保障系统安全。
9、责任心强,积极主动,有良好的沟通能力和团队合作能力。
加分项:
1、有大型互联网公司系统运维工作经验者优先。
2、具备性能分析、编译构建、容量规划、云上实施、故障定位和处理的经验优先。
3、熟悉天翼云平台的运维管理者优先。
4、有向量数据库运维经验者优先。