2-4万
中兴大道1040号
岗位概述:
多模态学习算法工程师负责设计和实现视觉、语言、位置等多种模态信息的融合算法。这个岗位需要在多模态学习领域有深入的研究和实践经验,能够处理复杂的跨模态对齐和融合问题。
核心职责:
多模态融合架构设计需要设计合适的网络架构,实现不同模态信息的有效融合。在智能无人机任务中,需要将语言指令、视觉感知、位置信息等多种异构数据进行融合,生成统一的环境理解和导航决策。
任职要求:
学历背景要求硕士以上学位,专业方向为计算机科学、人工智能或相关领域。
技术能力要求熟悉多模态学习的基础理论和方法,包括特征融合、注意力机制、对比学习等。精通深度学习框架,有大规模模型训练的经验。熟练使用 PyTorch 或 TensorFlow 进行模型开发,掌握 TorchScript、ONNX 转换与部署实践,熟悉 CUDA 编程、TensorRT 优化,具备 GPU/嵌入式推理性能调优实战经验,理解多模态数据融合原理,具备文本、图像、视频、语音等多种数据处理能力。
研究能力要求对多模态学习的前沿研究有深入了解,能够跟踪和应用最新的研究成果。有相关领域的论文发表经验者优先。
优先条件:
有智能无人机或视觉-语言导航的直接研究经验。
有视觉问答、图像描述等多模态任务的项目经验
有大规模预训练模型的训练和微调经验
有将大模型技术成功应用于实际产品(如机器人、自动驾驶、智能硬件)的落地经验。
了解无人机常用传感器及飞控接口,具备端云协同开发经验
有机器人或无人机项目的算法开发经验
在顶级会议或期刊发表过相关论文
在多模态学习或相关领域有多年的研发经验。
对AI具身智能和无人机事业有强烈热情,具备出色的学习能力和解决未知问题的能力,认可公司价值观。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕