一、岗位职责
1.负责轨道交通场景CV大模型建设与应用;
2.负责CV大模型的训练、微调、验证、部署与集成,确保模型达到预定性能目标;
3.负责推进分布式训练中的并行计算、通信优化、稳定性提升等工作;
4.负责利用多 GPU、多节点进行模型训练,提高训练效率,来提高模型的泛化能力;
5.组织与相关业务进行需求对接,撰写技术报告、模型 / 算法文档等。
二、任职要求
1.计算机科学或人工智能相关专业,硕士(5年以上工作经验)、博士;
2.熟悉模型部署流程,能够在不同的生产环境中部署模型,如云平台、边缘设备等,实施模型监控策略,跟踪模型性能,确保模型在生产环境中的稳定性和可靠性;
3.具有独立开发能力以及合作开发能力,具有较强的团队精神、良好的沟通协调能力、较强的分析和解决问题的能力。
三、专业技能
1.优秀的代码能力、数据结构和基础算法功底,熟悉CV相关开源模型、机器学习和深度学习模型(CNN、LSTM、 Transformer、GPT等),熟练掌握Python,熟悉Linux开发环境;
2.具备视觉大模型训练、调优和评估能力;
3.有机器学习框架经验者优先(TensorFlow/PyTorch);
4.有分布式训练工具经验者优先(Colossal-AI/DeepSpeed/Megatron)。