职位详情
视觉Agent大模型算法专家
面议
北京三快在线科技有限公司
上海
1-3年
硕士
06-18
工作地址

杨浦区

职位描述
基础研发平台是美团的核心技术平台,立足于“零售+科技”的战略定位,通过打造人工智能、大数据、云计算、安全等核心技术能力,以及研发效能平台、企业应用平台等公共服务,为业务提供稳定安全、扩展易用、技术领先的平台技术和产品服务。

在这里,我们会参与到最前沿的技术研发和探索;能够接触超规模集群、海量数据,挑战高复杂业务场景,有机会与业界一流的工程师一起并肩前行。

在这里,我们有超强的技术氛围,持续向社区贡献业界实践,加速行业技术发展;我们有完善的互联网学习生态圈,重视底层逻辑和方法论,助力职业生涯的非线性成长。

真诚地邀请你,和我们一起驱动技术发展,创造行业价值。

岗位职责

1. 负责视觉Agent系统的全链路设计与开发,构建融合多模态感知、动态决策与自动化执行的视觉智能系统,推动复杂场景下的图文多模态/视频理解、交互与生成能力。

2. 负责视觉Agent核心算法的研发与优化,包括但不限于多模态大模型视觉感知、图像生成、多模态对齐(如文本-图像-视频)等方向,持续提升系统的鲁棒性与泛化能力。

3. 研发视觉Agent的协作机制,支持多智能体协同任务(如跨模态推理、工具调用),优化模型在实时性、资源效率及长上下文处理中的表现。

4. 研发大模型在业务场景下关键能力的应用研发,包括但不限于知识和指令遵循、分析诊断、深度推理、反思和评估等能力的优化和落地。

5. 结合业务场景设计并落地视觉Agent应用,赋能业务智能化升级。

6. 跟踪计算机视觉与大模型交叉领域的前沿技术,探索创新技术在实际场景中的落地路径。

岗位基本需求

1. 计算机科学、人工智能、电子工程等相关专业硕士及以上学历,具有计算机视觉或视觉Agent相关研发经验。

2. 扎实的算法基础,熟悉主流视觉模型及多模态大模型,具备模型调优与轻量化部署经验。

3. 深入理解主流Agent框架原理,在任务规划、工具调用、策略优化等方向有实际项目经验;

4. 优秀的分析和解决问题的能力,项目推动力和团队协作能力。

具备以下者优先

1. 在视觉Agent相关领域发表顶会论文(CVPR/ICCV/ECCV/NeurIPS等)或主导过落地项目。

2. 开源社区贡献者或重要竞赛获奖者。

3. 具备大模型与视觉技术融合经验,具有突出的产品建设思维。

岗位亮点

1. 参与美团本地生活场景的视觉智能化革新,直接赋能数亿用户与千万商家。

2. 探索视觉Agent在生成式AI时代的核心技术,打造行业标杆级应用。

3. 在快速发展的领域中积累经验,成为大模型和智能体领域的专家。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请