【岗位职责】
1 、模型架构实现与代码开发
根据模型设计高级工程师的架构方案,负责将前沿的具身大脑模型(如多模态Transformer、世界模型、VLA模型等)转化为高质量、高性能的代码。使用PyTorch等主流深度学习框架,实现模型的网络结构、前向/后向传播、损失函数、数据处理等核心模块。
2 、训练Pipeline构建与优化
构建高效、可扩展的模型训练Pipeline,包括数据加载与预处理、分布式训练、混合精度训练、梯度累积等,确保大规模模型训练的稳定性和效率。负责训练过程的监控、调试和参数调优,使用Weights & Biases (WB)、MLflow等工具进行实验管理和结果分析,快速定位并解决训练中的问题。
3、 多模态数据处理与集成
负责处理和融合来自不同来源的多模态数据(如图像、点云、语言指令、关节状态、力反馈等),开发高效的数据加载器和预处理脚本。与数据样本工程师协作,确保数据格式、标注质量与模型训练需求无缝对接。
4 、模型评估与基准测试
实现模型的评估脚本,在标准基准(如Libero、CALVIN、RT-1等)和团队内部任务上对模型进行性能测试,生成详细的评估报告。负责模型的性能分析,识别模型瓶颈,为模型设计工程师的迭代优化提供数据支持和可行性建议。
5 、工程化部署与支持
负责模型的工程化封装,提供清晰的API接口,支持模型在仿真环境和真实机器人上的推理部署。与本体适配工程师、仿真工程师紧密协作,解决模型在部署过程中遇到的兼容性、性能等问题,确保端到端系统的顺畅运行。
【岗位要求】
1 、学历与专业背景
计算机科学、人工智能、自动化、电子工程等相关专业本科及以上学历,拥有2年以上深度学习模型开发经验。
2 、核心编程与工程能力
精通Python,具备扎实的编程基础和良好的代码风格,熟悉面向对象编程。
精通PyTorch框架,深入理解其核心原理,有从零实现复杂神经网络模型的经验。熟悉TensorFlow者加分。熟悉Linux开发环境,熟练使用Git进行版本控制,有Docker使用经验者优先。
3、 模型与算法认知
深入理解至少一种主流模型架构,如Transformer、CNN、RNN等,并了解其在视觉、语言或多模态领域的应用。熟悉深度学习的基本概念,如反向传播、优化器、损失函数、正则化等,并对强化学习、扩散模型等有基本了解。
4 、具身智能领域经验
对具身智能有浓厚兴趣,了解VLA(视觉-语言-动作)模型的基本概念,熟悉RT-1/2、OpenVLA、ACT等至少一种具身智能模型者优先。有处理机器人相关数据(如图像序列、关节轨迹、语言指令)的经验,或使用过ROS/ROS2者优先。
5 、大规模训练与系统经验
具备分布式训练的实践经验,熟悉多GPU、多节点的训练配置和优化(如使用torch.distributed)。有处理大规模数据集的经验,了解数据加载、存储和I/O优化的常见方法。
6 、软技能与综合素质
具备优秀的工程实践能力和问题解决能力,能够将复杂的理论设计转化为稳定、高效的工程代码。具备良好的沟通能力和团队协作精神,能够清晰地表达技术问题,并与不同角色的同事高效协作。学习能力强,对新技术充满热情,能够快速跟进领域内的最新进展。