9000-12000元
广州市-黄埔区-香雪八路98号广州香雪国际公寓2期f栋
岗位职责
1. 系统部署与配置:负责服务器操作系统的安装、批量初始化配置、软件安装、系统调优及安全加固。
2. 容器化平台搭建:设计并部署容器化编排平台(如 Kubernetes, Docker),包括 Master/Worker节点的配置、网络插件、存储插件的集成。
3. 集群网络规划与实施:设计并搭建集群内部网络,包括管理网络、业务网络、存储网络(如需要)的划分与隔离(VLAN/VxLAN),配置交换机、路由及防火墙策略。
4. 运维与监控:部署集中式监控系统(如 Prometheus + Grafana, Node Exporter)、日志系统(如 ELK),建立集群健康状态的可观测性。
5. 自动化脚本开发:编写Ansible、Shell/Python等自动化脚本,实现服务的批量部署、配置和管理。
6. 服务器维护:定位服务器问题,近端恢复服务器集群系统。
7. 客户培训与交付:向客户交付集群系统层面的文档,并进行必要的使用培训。
岗位要求
1. 计算机、电子、软件工程、网络工程等相关专业本科及以上学历
2. 精通 Linux 系统:深入理解 Linux 操作系统原理,熟练进行系统管理、性能诊断(CPU/内存/IO/网络)和故障排查。
3. 容器化技术:精通Docker容器技术,持续集成与部属,镜像构建优化,至少熟练掌握一种主流容器编排工具,Kubernetes为必须技能,包括其网络、存储、安全和服务暴露机制。
4. 网络知识:扎实的网络基础(TCP/IP, HTTP, DNS),熟悉常见网络设备(交换机、路由器)的配置,了解 SDN、Calico、Flannel 等容器网络方案。
5. 自动化运维工具:熟练使用Ansible进行自动化部署,熟悉Git版本控制。
6. 脚本能力:熟练掌握Shell脚本,具备Python或Go的脚本开发能力者优先。7. 服务器经验:有AI算力服务器(NV GPU,昇腾NPU,GPGPU等国产卡)工作经验优先,极强的逻辑思维和问题排查能力。
8. 具备良好的文档撰写习惯。
9. 具备良好的客户沟通能力,能清晰地向客户解释技术方案。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕