基础研发平台是美团的核心技术平台,立足于“零售+科技”的战略定位,通过打造人工智能、大数据、云计算、安全等核心技术能力,以及研发效能平台、企业应用平台等公共服务,为业务提供稳定安全、扩展易用、技术领先的平台技术和产品服务。
在这里,我们会参与到最前沿的技术研发和探索;能够接触超规模集群、海量数据,挑战高复杂业务场景,有机会与业界一流的工程师一起并肩前行。
在这里,我们有超强的技术氛围,持续向社区贡献业界实践,加速行业技术发展;我们有完善的互联网学习生态圈,重视底层逻辑和方法论,助力职业生涯的非线性成长。
真诚地邀请你,和我们一起驱动技术发展,创造行业价值。
岗位职责
1. 负责视觉Agent系统的全链路设计与开发,构建融合多模态感知、动态决策与自动化执行的视觉智能系统,推动复杂场景下的图文多模态/视频理解、交互与生成能力。
2. 负责视觉Agent核心算法的研发与优化,包括但不限于多模态大模型视觉感知、图像生成、多模态对齐(如文本-图像-视频)等方向,持续提升系统的鲁棒性与泛化能力。
3. 研发视觉Agent的协作机制,支持多智能体协同任务(如跨模态推理、工具调用),优化模型在实时性、资源效率及长上下文处理中的表现。
4. 研发大模型在业务场景下关键能力的应用研发,包括但不限于知识和指令遵循、分析诊断、深度推理、反思和评估等能力的优化和落地。
5. 结合业务场景设计并落地视觉Agent应用,赋能业务智能化升级。
6. 跟踪计算机视觉与大模型交叉领域的前沿技术,探索创新技术在实际场景中的落地路径。
岗位基本需求
1. 计算机科学、人工智能、电子工程等相关专业硕士及以上学历,具有计算机视觉或视觉Agent相关研发经验。
2. 扎实的算法基础,熟悉主流视觉模型及多模态大模型,具备模型调优与轻量化部署经验。
3. 深入理解主流Agent框架原理,在任务规划、工具调用、策略优化等方向有实际项目经验;
4. 优秀的分析和解决问题的能力,项目推动力和团队协作能力。
具备以下者优先
1. 在视觉Agent相关领域发表顶会论文(CVPR/ICCV/ECCV/NeurIPS等)或主导过落地项目。
2. 开源社区贡献者或重要竞赛获奖者。
3. 具备大模型与视觉技术融合经验,具有突出的产品建设思维。
岗位亮点
1. 参与美团本地生活场景的视觉智能化革新,直接赋能数亿用户与千万商家。
2. 探索视觉Agent在生成式AI时代的核心技术,打造行业标杆级应用。
3. 在快速发展的领域中积累经验,成为大模型和智能体领域的专家。