工作职责:
1.主导大模型(LLM、CV、多模态、时序等主流大模型)智能体或RAG等关键技术的训练框架设计、分布式训练优化及推理加速技术研发。
2.负责模型压缩(量化、剪枝)、低资源推理(边缘计算/端侧部署)及性能调优,提升模型效率与成本收益。
3.搭建高可用训练基础设施(如GPU集群管理、分布式训练框架开发),解决超大规模数据并行与模型并行的技术难题。
4.作为核心骨干配合国家省部级项目申报、建设和交付等。
5.跟踪前沿技术,推动技术成果在业务场景的转化。
6.带领研发团队完成技术攻关,制定技术规划和路线,协调跨部门资源推进项目落地。
任职要求:
1. 计算机科学、人工智能、数学等相关专业,博士学位。
2. 工作经验:三年以上大模型训练/推理研发经验和团队管理经验。
3. 技术能力:
(1)技术视野开阔,具备跨团队协作与复杂项目管理能力,能承受高压环境
(2)精通PyTorch/TensorFlow等框架,熟悉Megatron-LM、DeepSpeed等分布式训练工具;
(3)深入理解Transformer/BERT/GPT等模型架构,具备模型并行、流水线并行实战经验;
(4)熟悉模型量化(INT8/FP16)、知识蒸馏、推理引擎(TensorRT/ONNX Runtime)优化技术;
(5)有千亿参数级模型训练或高并发推理系统开发经验者优先。
4. 学术能力:在国际顶会(NeurIPS/ICML/ACL等)发表相关论文或拥有专利者优先。
5. 正直诚信,积极上进,吃苦耐劳,善于沟通。
6. 具有高度的责任心和出色的团队领导力、书面表达力及抗压能力。