岗位职责:
1.负责大规模预训练模型的研发工作,包括架构设计、训练优化、分布式加速等核心技术攻关 ;
2.主导大模型在具体业务场景(NLP/CV/多模态/生理信号等)的应用落地,设计创新解决方案 ;
3.构建模型微调、提示工程、模型压缩等工业化应用技术体系;
4.与产品、数据、工程团队紧密协作,推动算法到产品的全流程落地 ;
5.跟踪学术界与工业界前沿技术动态,探索大模型领域创新方向 。
任职要求:
【硬性条件】
1.计算机/数学/ 人工智能相关专业统招硕士及以上学历 ;
2.两年以上大模型及五年以上AI算法相关研发经验 ;
3.深入理解Transformer/BERT/GPT等架构,掌握PyTorch/TensorFlow框架
4.具备分布式训练实战经验(Megatron/DeepSpeed/FairScale等) ;
5.熟悉主流大模型技术栈(LangChain/LLAMA/扩散模型等)。
【核心能力】
1.扎实的算法基础:精通 机器学习 / 深度学习 理论,代码实现能力强(LeetCode中级以上);
2.工程落地能力:具有亿级参数模型训练调优经验,熟悉模型服务化部署
3.业务洞察力:能准确理解业务需求,设计合理的模型应用方案 ;
4.团队协作力:优秀的跨团队沟通能力,能有效协调多方资源推进项目。
优先条件:
△在ACL/NeurIPS/CVPR等顶会发表过相关论文
△有开源项目核心贡献或Kaggle等竞赛top成绩
△具备多模态大模型/强化学习/知识图谱交叉经验
△熟悉中医/医疗/ 生物医药 等垂直领域知识者优先
此职位为专家方向和工程师职位同步招聘,通过面试情况定岗,专家级直接汇报总裁,薪酬OPEN可再沟通