岗位职责:
1、服务器部署与维护:负责服务器硬件安装、调试与扩容,部署操作系统及必要软件,定期巡检硬件状态与系统运行情况,及时更换故障部件。合理分配 CPU、内存、存储等资源,监控资源使用率,优化资源配置,提升服务器利用率。
2、容器平台搭建与运维:负责 Docker、K8s 集群的部署、升级与日常维护,优化集群资源配置,保障平台稳定、高效运行。推动业务应用从物理机 / 虚拟机向容器化迁移,设计容器化方案,编写 Dockerfile、K8s 资源清单,实现应用标准化部署。
3、自动化与 CI/CD 建设:搭建容器化相关 CI/CD 流水线,整合代码编译、镜像构建、测试、部署等环节,提升研发交付效率。
4、监控与故障处理:配置容器集群及应用的监控、告警与日志收集体系,快速定位并解决服务器硬件故障、系统崩溃、网络中断等问题,制定应急处理预案,保障业务系统不间断运行。
5、性能优化与安全管控:优化容器资源利用率、应用运行性能,制定容器镜像安全规范,管控镜像仓库与容器权限,保障容器化环境安全合规;
6、技术支持与沉淀:为研发、运维团队提供容器化技术支持,输出技术文档、操作手册与最佳实践,推动团队容器化技术能力提升。
任职要求:
1、学历与专业:本科及以上学历,计算机、软件工程、云计算等相关专业优先。
2、核心技术技能:精通服务器硬件(CPU、内存、存储等)选型与维护,熟练掌握 Windows Server、Linux 等主流服务器操作系统部署与配置,熟悉服务器虚拟化技术(VMware、Hyper-V)。精通 Docker 容器技术,熟练掌握 Kubernetes(K8s)集群部署、配置与运维,熟悉容器网络(Calico、Flannel)、存储(PV/PVC、NFS)方案。了解网络基础(TCP/IP、路由交换)与存储技术(SAN、NAS),掌握服务器监控工具使用,具备故障排查与应急处理能力。
3、拓展技能与工具:了解 CI/CD 流水线工具(Jenkins、GitLab CI),掌握 Shell/Python 脚本编写,熟悉云平台(AWS、阿里云、华为云)容器服务,具备监控告警(Prometheus、Grafana)配置能力。
4、经验与资质:2-5 年容器化 / 云原生相关经验,有大规模 K8s 集群运维或复杂应用容器化迁移经验者优先,持有 CKA、CKAD 等认证加分,。
5、职业素养:具备较强的故障排查与应急处理能力,逻辑思维清晰,注重自动化与效率提升,有跨团队协作与文档沉淀意识,责任心强,严谨细致,能接受 7x24 小时应急值守,具备良好的沟通协调能力,严格遵守机房安全与数据规范。