职位描述
岗位职责
- AI训练与优化,负责AI大模型的训练,标注和整理业务数据,调整模型参数,优化训练效果,提升预测和泛化能力,降低过拟合风险,并适应新数据和需求。
- 新prompt设计与迭代,根据任务和业务需求,设计新的prompt,并持续优化和迭代,以满足业务目标。
- 技术与业务沟通,训练工程师需与业务方紧密沟通,参与项目评审和开发测试,通过AI技术赋能业务。
任职要求
- 本科及以上学历,计算机科学、软件工程、电子信息、数学等相关专业优先。计算机科学与软件工程专业能为掌握训练系统架构、代码实现打下坚实基础;电子信息专业有助于理解硬件底层原理,更好地进行算力优化;数学专业背景可助力理解模型训练中的数学原理与算法逻辑。
- 具有 2 - 5 年模型训练相关工作经验,参与过大型深度学习项目的训练环节,从模型搭建初始到最终训练完成并达到预期效果,积累了丰富的实战经验,熟悉不同模型架构在训练过程中的特性与挑战 。
- 精通深度学习框架,如 TensorFlow、PyTorch 等,熟练掌握框架的高级特性,包括模型的构建、训练、评估、保存与加载等操作,能依据模型需求灵活调整框架参数,优化训练流程。
- 熟悉多种机器学习与深度学习算法基础,虽不要求像算法工程师那般深入推导算法,但要了解常见算法(如神经网络、卷积神经网络、循环神经网络等)的训练原理,以便在训练过程中精准诊断问题并进行针对性调整。
- 掌握分布式训练技术,熟悉如何在集群环境下利用多机多卡进行模型并行与数据并行训练,了解 GPU 编程与优化技巧,熟知如 NVIDIA 的 CUDA 编程模型,能够充分挖掘硬件算力潜能,加速大模型训练进程。
- 具备扎实的编程技能,熟练使用 Python、C++ 等编程语言,能编写高效的数据预处理、后处理脚本,协同模型训练流程,确保数据流畅通无阻,为训练提供高质量的数据支持。
- 具备严谨的科学态度,在模型训练过程中,对每一个训练参数、每一次数据加载都要严格把关,确保训练结果的准确性与可靠性,不容许因疏忽导致训练失败或结果偏差。
工作地址:成都市郫都区西源大道70号8号楼。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕