职位描述
技能要求:
1.mysql mongo redis elasticsearch等中间件数据备份\迁移,维护技术
2.掌握日常k8s运维命令,可读写yaml文件,维护k8s集群
3.掌握日常运维linux命令,ansible使用,安全漏洞修复
4.熟悉gpu npu驱动。可做环境适配算力卡调度问题排查
5.能独自排查处理问题,可与同事,甲方有效沟通
6.掌握prometheus altermanager garafna监控活其他监控技术
7.接触过开源大模型如deepseek,千问或者其他功能模型
加分项:
从事过三大运营商项目。接触过智能体,完成过ai相关项目加分
岗位职责:
1、负责部门AI平台、引擎能力类项目的系统建设、交付部署和日常运维工作;
2、负责国产化改造和基于国产化资源的项目建设交付,包括系统国产化、硬件国产化、数据库国产化等;
4、负责项目交付过程中的日常问题支撑、业务对接联调等技术支持工作;
任职要求:
1、具体丰富的运营商线上系统建设经验、运维保障经验;
2、具备大规模集群设备区管理维护经验;
2、具有良好安全意识,清晰认识线上系统运维保障安全事项和操作细节;
3、熟悉hadoop、elasticserch、ceph、docker、k8s等主流开源中间,具备部署建设、安全加固、和独立问题处理能力;
4、掌握Shell、Python、Go中的一种或多种语言,熟练使用Saltstack、Ansible、Puppet中的一种或多种自动化工具;
5、熟练掌握网络、数据库等知识,具备系统高可用实现能力、排错能力;
6、具备aarch64系统环境,飞腾、鲲鹏等国产硬件以及欧拉、麒麟等国产操作系统和国产化数据库建设交付经验;
7、工作认真踏实,态度端正,具有良好抗压能力;
8、具备良好的沟通能力、执行力、文档编写能力;
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕