职位详情
多模态学习算法工程师
2-4万
浙江氢源智能科技有限公司
湖州
3-5年
硕士
08-14
工作地址

中兴大道1040号

职位描述

岗位概述:

多模态学习算法工程师负责设计和实现视觉、语言、位置等多种模态信息的融合算法。这个岗位需要在多模态学习领域有深入的研究和实践经验,能够处理复杂的跨模态对齐和融合问题。

核心职责:

多模态融合架构设计需要设计合适的网络架构,实现不同模态信息的有效融合。在智能无人机任务中,需要将语言指令、视觉感知、位置信息等多种异构数据进行融合,生成统一的环境理解和导航决策。

任职要求:

学历背景要求硕士以上学位,专业方向为计算机科学、人工智能或相关领域。

技术能力要求熟悉多模态学习的基础理论和方法,包括特征融合、注意力机制、对比学习等。精通深度学习框架,有大规模模型训练的经验。熟练使用 PyTorch 或 TensorFlow 进行模型开发,掌握 TorchScript、ONNX 转换与部署实践,熟悉 CUDA 编程、TensorRT 优化,具备 GPU/嵌入式推理性能调优实战经验,理解多模态数据融合原理,具备文本、图像、视频、语音等多种数据处理能力。

研究能力要求对多模态学习的前沿研究有深入了解,能够跟踪和应用最新的研究成果。有相关领域的论文发表经验者优先。

优先条件:

有智能无人机或视觉-语言导航的直接研究经验。

有视觉问答、图像描述等多模态任务的项目经验

有大规模预训练模型的训练和微调经验

有将大模型技术成功应用于实际产品(如机器人、自动驾驶、智能硬件)的落地经验。

了解无人机常用传感器及飞控接口,具备端云协同开发经验

有机器人或无人机项目的算法开发经验

在顶级会议或期刊发表过相关论文

在多模态学习或相关领域有多年的研发经验。

对AI具身智能和无人机事业有强烈热情,具备出色的学习能力和解决未知问题的能力,认可公司价值观。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请