职位详情
运维工程师(AI项目)
1.3-1.5万
四川智服人力资源有限公司
厦门
3-5年
本科
03-04
工作地址

厦门市公安局翔安分局1

职位描述
职位描述
1、熟悉常见的应用架构规划,梳理部署架构图;
2、整理交付运维常见文档,部署方案,部署手册,常见问题清单,运维手册等等;
3、支持项目上其他工作
4、Kubernetes平台管理与优化
5、集群管理:负责投研平台的Kubernetes集群(CPU & GPU)的部署、升级、扩缩容、监控和故障排除,确保其高可用性与高性能
6、架构优化:设计和实现集群的网络(CNI)、存储(CSI)、安全策略与资源调度优化
7、权限管理:管理集群的认证授权(RBAC)、配额管理和成本优化
研发效能与自动化
8、CI/CD建设:构建和维护从代码提交到构建、测试、部署的CI/CD流水线(基于GitLab CI/Jenkins/Argo CD等)
9、标准化部署:开发和维护统一的应用部署模板与标准(Helm Charts、Kustomize),降低研发团队的使用门槛
10、环境管理:实现研发环境的快速搭建与复制,支持团队进行高效的代码调试和集成测试
11、可观测性与稳定性建设
12、监控体系:设计和维护集成的日志、监控、告警体系(技术栈如Prometheus、Grafana、ELK)
13、任务调度:建立和完善统一的任务调度平台,并确保其稳定运行
14、容灾备份:参与制定并实施灾难恢复和业务连续性计划
15、平台化与数据治理支持
16、平台化产品:将基础设施能力产品化,为客户提供自助式服务平台
17、运行环境:协助团队提供稳定、隔离、资源可控的运行时环境
18、最佳实践:推动基础设施即代码和GitOps的最佳实践,确保所有配置可追溯、可复制
职位要求
必备条件
学历背景:本科及以上学历
1、工作经验:至少2年以上基础设施/云原生/SRE相关工作经验
2、集群经验:拥有从零到一构建或深度管理大规模Kubernetes生产环境的经验
3、核心技术栈
Kubernetes:
精通Kubernetes的架构、核心概念与云原生的生态系统
具备扎实的故障排查能力
编程能力:
熟练掌握至少一种编程语言,如Go、Python或Shell
用于自动化脚本和工具开发
CI/CD经验:
拥有丰富的CI/CD流水线设计和实施经验
精通Git工作流
系统与网络:
具备扎实的Linux操作系统和网络知识
深入理解Linux/Windows类系统,熟悉常见服务的安装配置、优化、高可用
如Nginx、MQ、Redis、keepalived、haproxy等
网关服务:
深入理解Nginx等网关的工作原理
具备大型互联网系统网关服务的维护经验
能处理高并发流量、精通路由配置、安全防护与故障诊断
可观测性能力
监控体系:拥有构建企业级监控和日志系统的实际经验
工具使用:熟悉Prometheus、Grafana、ELK等工具
优先条件
AI经验:熟悉在Kubernetes上运行大模型、应用服务的经验
GitOps工具:熟悉Argo CD等GitOps工具,或Apache Airflow等任务调度系统
云服务经验:具备Kubernetes服务(EKS、GKE、AKS)的实战经验

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请