工作职责
1.研发下一代自动驾驶多模态大模型算法,探索基于VLMVLA、LLM、Diffusion等生成式模型技术的算法方案;
2.参与大规模数据集的处理和标注算法开发工作,参与大模型预训练、对齐和微调等工作,以此提升系统性能
3.和其他团队协作完成大模型的工程优化和部署落地工作,解决模型在实际应用中遇到的性能问题持续优化模型效果;
4.跟踪最新的大模型相关技术动态,对可应用于驾驶场景的新技术进行技术调研和原型验证。
任职要求:
1.计算机科学、信息工程、电子工程、机器人等专业硕士及以上学历;
2.具备多模态大模型或语言大模型训练经验,熟悉目前主流的大模型训练方法,熟练掌握各种微调技术;
3.了解并行训练原理,熟练使用主流大模型训练框架(DeepSpeed/LaMMA-Factory /Megatron...);
4.深入了解数据结构、算法、并行编程、代码优化和大规模数据处理等相关知识,有良好的代码风格和文档撰写能力。