2-3万
华熙国际中心-C座21层
一、岗位职责:
1.负责大规模预训练模型的研发工作,包括架构设计、训练优化、分布式加速等核心技术攻关;
2.主导大模型在具体业务场景(NLP/CV/多模态/生理信号等)的应用落地,设计创新解决方案;
3.构建模型微调、提示工程、模型压缩等工业化应用技术体系;
4.与产品、数据、工程团队紧密协作,推动算法到产品的全流程落地;
5.跟踪学术界与工业界前沿技术动态,探索大模型领域创新方向;
二、任职要求:
【硬性条件】
1.计算机/数学/人工智能相关专业硕士及以上学历;
2.两年以上大模型及5年以上AI算法相关研发经验;
3.深入理解Transformer/BERT/GPT等架构,掌握PyTorch/TensorFlow框架;
4.具备分布式训练实战经验(Megatron/DeepSpeed/FairScale等);
5.熟悉主流大模型技术栈(LangChain/LLAMA/扩散模型等)。
【核心能力】
1.扎实的算法基础:精通机器学习/深度学习理论,代码实现能力强(LeetCode中级以上);
2.工程落地能力:具有亿级参数模型训练调优经验,熟悉模型服务化部署;
3.业务洞察力:能准确理解业务需求,设计合理的模型应用方案;
4.团队协作力:优秀的跨团队沟通能力,能有效协调多方资源推进项目。
【优先条件】
1.在ACL/NeurIPS/CVPR等顶会发表过相关论文;
2.有开源项目核心贡献或Kaggle等竞赛top成绩;
3.具备多模态大模型/强化学习/知识图谱交叉经验;
4.熟悉中医/医疗/生物医药等垂直领域知识者优先。
我们提供:
1.与顶尖AI团队共同成长的机会;
2.开放的技术氛围与持续学习机制;
3.员工福利补贴。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕