职位详情
大模型训练推理高级专家 已下线
5-8万
中国电信股份有限公司北京云网操作系统研发中心
北京
5-10年
硕士
08-04
工作地址

中国电信股份有限公司北京研究院(蓬莱苑南路)

职位描述
任职资格:
1.学历:硕士及以上学历,计算机科学、人工智能、数学等相关专业;
2.工作经验:3年以上大模型训练/推理研发经验,2年以上10人以上团队管理经验。有头部AI实验室、科技大厂或独角兽企业核心项目经历
3. 技术能力:
1)精通PyTorch/TensorFlow等框架,熟悉Megatron-LM、DeepSpeed等分布式训练工具;
2)深入理解Transformer/BERT/GPT等模型架构,具备模型并行、流水线并行实战经验;
3)熟悉模型量化(INT8/FP16)、知识蒸馏、推理引擎(TensorRT/ONNX Runtime)优化技术;
4)有千亿参数级模型训练或高并发推理系统开发经验者优先。
3.学术能力:在顶会(NeurIPS/ICML/ACL等)发表相关论文或拥有专利;
4.技术视野开阔,具备跨团队协作与复杂项目管理能力,能承受高压环境。
岗位职责:
1.主导大模型(LLM、CV、多模态、时序等主流大模型)的训练框架设计、分布式训练优化及推理加速技术研发。
2. 负责模型压缩(量化、剪枝)、低资源推理(边缘计算/端侧部署)及性能调优,提升模型效率与成本收益。
3. 搭建高可用训练基础设施(如GPU集群管理、分布式训练框架开发),解决超大规模数据并行与模型并行的技术难题。
4. 跟踪前沿技术,推动技术成果在业务场景的转化。
5. 带领研发团队完成技术攻关,制定技术规划和路线,协调跨部门资源推进项目落地。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

查看更多相似职位