1.1-1.8万·13薪
新希望国际B座
公司致力于人工智能领域前沿技术研发,现因业务扩展需要,诚聘资深大模型系统工程师加入我们的技术团队,共同推动智能算力基础设施的创新发展。
工作地点: [西安、成都、贵阳]
岗位职责:
负责大模型训练/推理系统的部署、优化与维护
搭建和维护AI基础设施(GPU/DCU/NPU集群)
设计高可用系统架构,优化Linux环境下Docker/Kubernetes等容器化部署方案
保障分布式存储(MinIO)、缓存(Redis)、搜索(Elasticsearch)等中间件的稳定运行
开发自动化运维脚本(Shell/Python),提升系统管理效率
进行大模型性能调优,解决分布式训练中的系统级问题
维护MySQL/PostgreSQL数据库集群,保障数据服务可靠性
任职要求:
计算机/电子工程相关专业本科及以上学历
5年以上Linux系统运维/架构师经验,3年以上AI系统相关经验
精通以下技术栈:
▸ 操作系统:CentOS/Ubuntu等主流Linux发行版
▸ 容器化技术:Docker/Nginx/K8s深度使用经验
▸ 数据库:MySQL/PostgreSQL至少精通一种
▸ 硬件加速:英伟达GPU/海光DCU/昇腾NPU部署调优经验
熟练掌握Shell/Python自动化脚本开发
具备大模型(LLM)分布式训练/部署实战经验
熟悉主流深度学习框架(PyTorch/TensorFlow)部署模式
优秀的系统问题定位与性能优化能力
加分项:
有大模型落地项目经验者优先
熟悉分布式文件系统(Ceph/GlusterFS)部署
具有Kubernetes集群管理认证(CKA/CKAD)
掌握Go/C++等系统级开发语言
熟悉AWS/Azure/华为云等云平台AI服务
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕