职位描述
【岗位职责】
1、负责大模型(LLM)的预训练、微调(SFT、LoRA/QLoRA)、对齐优化(PPO、DPO、GRPO)及性能调优;
2、负责设计领域定制化模型方案,提升模型在垂直场景(如金融、医疗、教育)的准确性与效率;
3、负责推动大模型在业务场景的应用部署,集成LangChain、vLLM等工具链,实现检索增强生成(RAG)、多步推理等复杂工作流;
4、负责优化模型推理性能,解决高并发、低延迟等生产环境问题;
5、负责跟踪NeurIPS、ICML、ACL等顶会研究动态,探索多模态、模型压缩、分布式训练等前沿方向,带领团队在人工智能领域取得理论和应用原创性成果,推动技术创新。
【任职要求】
1、学历要求:国内外高校应届毕业生,具备博士研究生学历、并取得相应学历和学位证书(国外高校毕业生需取得国家教育部学历学位认证)。
2、专业要求:计算机类、电子信息类、数学类相关专业。
3、技能要求:了解当前人工智能技术创新特征、演进趋势及业内主流AI产品;熟悉常用的深度学习框架,算法及人工智能前沿技术,并能应用于具体业务场景;具有项目开发经验,且至少熟练掌握一种机器学习相关的编程语言;深度理解以下一种或多种人工智能算法:机器学习、深度学习、计算机视觉、深度强化学习、非监督学习、自我监督学习等;具有阅读及综述英文文献并重现文献中算法的能力。
4、综合素质:具有较强的独立工作能力和再学习能力,以及分析问题和解决问题的能力;具有较强的沟通、协调能力和团队协作意识。
5、其他要求:身体健康,品行端正,勤奋踏实,具备良好的心理素质和身体素质,能够承受较大工作压力。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕