职位描述
岗位职责:
(1)协助甲方相关系统规划和日常运维工作,包括预防性检查、故障应急、性能优化、问题跟进、技术研究支持等;
(2)负责管理和维护K8s平台(如华为CCE、阿里ACK、自建K8s集群等),优化集群,保证平台稳定和高可用;
(3)负责AI平台和GPU算力虚拟化平台,解决开发提出的需求,保证平台稳定和高可用,协助甲方提升整体算力集群的利用率;
(4)负责相关自动化运维脚本和工具的开发,提升主机和云平台相关系统的运维效率、降低成本,提升系统的可靠性;
(5)负责编写和维护系统文档,总结运维经验和最佳实践;
(6)负责运维制度和流程的规范化和推进工作;
任职要求:
(1 )本科或以上,(计算机、通信相关专业,有金融行业运维经验者优先);
(2) 熟悉K8S容器技术,有3年以上容器运维管理经验,具备K8s相关证书者优先;
(3) 熟悉AI平台和GPU算力集群运维,有实际工作经验;
(4) 熟悉Linux操作系统,有3年以上操作系统运维管理经验;
(5) 熟练使用Bash、PowerShell、Python等脚本语言,具备3年以上的运维开发经验;
(6) 具有良好的沟通协调能力、逻辑分析能力、技术研究能力、文档编写能力;
(7) 积极主动、能够承受工作压力,具有保密意识。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕