岗位职责:
1、参与大模型(LLM、多模态模型等)的训练、调优与迭代,优化模型性能与效率;2、研究大模模型相关核心技术,如 Prompt Engineering、模型压缩、推理加速等,解决实际业务问题;
3、与产品、项目团队协作,将大模型技术落地到具体业务场景(如智能客服、内容生成等);
4、跟踪大模型领域前沿技术与研究成果,推动团队技术能力提升。
任职要求:
1、统招本科及以上学历,计算机、数学、人工智能等相关专业,3 年以上大模型或 NLP 领域工作经验;
2、精通 PyTorch/TensorFlow 等深度学习框架,熟悉大模型训练、微调流程(如 LoRA、QLoRA);
3、具备扎实的数学基础(线性代数、概率论)与算法能力,了解 Transformer 架构原理;
4、有大模型落地项目经验(如模型部署、性能优化)者优先,发表过相关顶会论文者优先;
5、具备良好的沟通能力与团队协作精神,能独立承担技术任务。