岗位职责
1.主导代码大模型的架构设计与研发工作,参与模型核心算法的迭代优化;
2.深度参与大模型原理研究,制定针对性的微调策略,重点提升模型在代码生成、逻辑推理、多语言支持等任务中的效果;
3.负责模型训练全流程管控,包括数据去重、预处理、训练参数调优及算子优化等关键环节;
4.推动研发成果在实际项目中的落地应用,跟进技术验证与问题修复,确保模型性能达标。
任职要求
1.211/985 院校研究生及以上学历(在读、应届或毕业五年内均可)计算机科学、人工智能、软件工程等相关专业优先;
2.具备代码生成大模型或其他大模型微调相关项目经验,熟悉模型训练全流程(数据处理 - 模型调优 - 效果验证);
3.精通 Python/C++ 编程语言,能独立完成算法代码实现与工程化落地
熟悉 CUDA、TVM 或 OpenCL 等加速框架,了解 GPU 并行计算原理;拥有扎实的算法推导能力与工程实践经验,能解决模型训练中的复杂技术问题;
4.协作能力:具备优秀的远程协作意识与独立推进能力,能在无现场监督的情况下高效完成工作任务。
亮点
1.弹性工作时间,无需坐班,平衡工作与个人安排,远程线上协作,通过视频会议、即时通讯工具同步项目进展;
2.清晰的任务目标与合理的交付周期,避免无效加班;
3.项目结束后可获得项目参与证明,优秀贡献者有机会建立长期合作关系。