工作职责:
1.精通 Docker 容器技术,拥有自建或基于公有云的 Kubernetes 集群运维经验,为容器云平台稳定运行筑牢基础。
2.主导容器云平台的设计、研发与维护,涵盖基础架构规划、自动化部署、监控搭建、性能优化与问题解决,保障平台高效运转。
3.负责 Linux 和 Windows Server 系统运维管理,完成安装配置、监控告警、故障排查与日常维护,确保服务器稳定可靠。
4.参与公司 IT 系统稳定性建设,制定故障预防措施,组织 SOP 演练与应急预案实施,提升系统容灾和故障处理能力。
5.推动运维流程自动化,借助脚本和工具开发提高运维效率,降低人工操作风险,提升整体运维水平。
6.负责网络及云平台安全配置管理与优化,确保系统和数据安全合规,防范各类安全威胁。
任职要求:
1.统招本科及以上学历,计算机、软件工程等相关专业,3 年以上运维工作经验,具备扎实专业知识和丰富实践经验。
2.深入理解 Linux 操作系统内核与体系结构,有扎实的系统管理和故障排查能力,能快速解决系统难题。
3.精通 Docker 与 Kubernetes 管理,有生产环境业务支撑经验,可保障容器化业务稳定运行。
4.熟悉 Nginx、Haproxy 等接入层技术,能进行系统优化与高可用配置,提升系统性能和可用性。
5.熟练使用 Zabbix 、Grafana、Prometheus、ELK等监控工具,可搭建和优化企业级监控体系,及时发现和解决潜在问题。
6.具备 CI/CD 落地经验,熟悉敏捷开发流程,能有效促进开发与运维协作,加快项目交付。
7.精通 Shell、Python 等脚本语言,可独立编写运维自动化脚本,提高工作效率和准确性。
8.熟悉网络架构与云平台安全管理,能主动预防安全风险,保障系统数据安全。
9.责任心强、积极主动,有良好沟通和团队合作能力,保障工作高效推进和团队协作顺畅。
加分项:
1、有大型互联网公司系统运维工作经验者优先。
2、具备性能分析、编译构建、容量规划、云上实施、故障定位和处理的经验优先。
3、熟悉天翼云平台的运维管理者优先。
4、有向量数据库运维经验者优先。