岗位职责:
1.核心算法研发与迭代
1.1 负责机器人视觉感知核心算法的研究、开发与迭代,涵盖基于图像/点云的目标检测、识别、跟踪、分割等任务。
1.2 深入探索基于多模态视觉-语言模型(VLM)的场景理解与事态感知技术(如复杂行为识别、异常事件检测等),提升机器人对动态环境的认知能力。
1.3 研究与开发多传感器(如多目相机、激光雷达)的时空对齐与融合感知算法,构建鲁棒、精确的环境理解系统。
2.算法工程化与系统部署
2.1 主导视觉算法从模型到产品级的工程化落地,负责模型的轻量化、推理加速及在嵌入式、机器人平台等边缘计算设备上的适配与优化。
2.2 设计与实现高实时性、高可用的视觉处理Pipeline,满足机器人低延迟、高并发的实时交互与决策需求。
2.3 推动模型蒸馏、量化等技术的应用,平衡算法性能与计算资源占用。
3.数据体系建设与模型持续优化
3.1 构建和完善视觉数据闭环体系,主导或参与关键业务场景的数据采集、标注、清洗、增强及管理工作,以数据驱动算法迭代。
3.2 系统性分析与解决算法长尾问题,针对遮挡、快速运动、弱光照、密集目标交互等复杂业务场景,从模型结构、损失函数、训练策略等多维度进行持续优化,提升模型泛化能力与场景适应性。
4. 技术调研与创新落地
4.1 紧密跟踪计算机视觉(如YOLO系列、DETR系列模型)与多模态感知领域的前沿技术演进,评估其在机器人业务中的应用潜力。
4.2 负责新技术、新方案的预研、原型验证与工程化导入,为产品进行前瞻性的技术布局。
5. 跨团队协作与系统集成
5.1与机器人软件、硬件、控制系统及AI团队紧密协作,完成感知算法在真实机器人平台上的集成、调试、性能优化与长期维护。
任职要求:
基本要求:
1.本科及以上学历,计算机科学、电子工程、自动化、机器人、应用数学等相关专业。3年以上计算机视觉或机器人感知算法研发经验,有带领技术模块或独立负责完整项目经验者优先。
2.算法基础:扎实的机器学习、深度学习理论基础,熟悉计算机视觉核心领域(检测、跟踪、分割、Re-ID等)的经典与前沿算法。
3.模型开发:精通PyTorch或TensorFlow等至少一种主流深度学习框架,具备丰富的模型训练、调参、优化及实验设计经验。
4.工程能力:具备较强的算法工程化与落地能力,熟悉模型轻量化(如剪枝、量化、蒸馏)、推理加速(如TensorRT、OpenVINO、ONNX)技术,有C++/Python高性能代码开发与优化经验。
5.技术广度:熟悉目标检测、多目标跟踪(MOT)领域的主流架构(如YOLO系列、DETR系列、ByteTrack等),并对其演进有深入理解。对视觉-语言模型(VLM)、多模态感知、传感器融合有研究或项目经验者优先。
6.数据处理:具备良好的数据处理和分析能力,熟悉数据采集、标注、清洗、增强全流程,能利用数据驱动解决模型的长尾问题。
加分项:
1.有完整的机器人、自动驾驶或相关领域的视觉感知算法落地项目经验,熟悉从算法研发到嵌入式/边缘端部署的全流程。
2.具备优秀的复杂问题分析、拆解与解决能力,能够针对实际场景中的难点(如遮挡、运动模糊、光照变化等)进行系统性优化。
3.具备优秀的技术调研、文献阅读、原型快速验证及技术选型能力。
4.有较强的责任心和自驱力,对技术有热情,乐于接受挑战,能适应快速迭代的开发节奏。
5.在会议(CVPR、ICCV、ECCV、IROS、ICRA等)或期刊上发表过相关论文。
6.具备良好的跨团队沟通与协作能力,能够清晰阐述技术方案并与软件、硬件团队高效合作。