「北京朝阳区视觉内容理解大模型算法工程师招聘」

职位详情

视觉内容理解大模型算法工程师已下线

面议

北京三快在线科技有限公司

北京

1年以下

硕士

06-26

工作地址

望京

职位描述

基础研发平台是美团的核心技术平台，立足于“零售+科技”的战略定位，通过打造人工智能、大数据、云计算、安全等核心技术能力，以及研发效能平台、企业应用平台等公共服务，为业务提供稳定安全、扩展易用、技术领先的平台技术和产品服务。

在这里，我们会参与到最前沿的技术研发和探索；能够接触超规模集群、海量数据，挑战高复杂业务场景，有机会与业界一流的工程师一起并肩前行。

在这里，我们有超强的技术氛围，持续向社区贡献业界实践，加速行业技术发展；我们有完善的互联网学习生态圈，重视底层逻辑和方法论，助力职业生涯的非线性成长。

真诚地邀请你，和我们一起驱动技术发展，创造行业价值。

岗位职责

1.基于多模态大模型技术，提升富文本图像、视频内容的端到端解析理解能力，如行业文档图像、电商场景图像、屏幕录制图像视频等。

2.推进建设大模型产品解决方案，推动相关算法在业务场景中落地，赋能商家入驻、企业办公、风控合规、自动化测试等业务的智能化升级。

3.负责包含但不限于优化多模态大模型的图文理解能力、协同大模型相关产品建设、服务部署落地全流程、构建流程自动化系统等。

岗位基本需求

1.具有一年以上多模态大模型算法研发经历，参与过模型训练、调优、部署等，计算机相关专业硕士及以上学历。

2.在以下领域有较深入的研究经验，包括但不限于：图像/视频分类和识别、文字识别、目标检测、图像分割。

3.在机器学习和深度学习方面具备扎实的理论基础和工程能力，熟悉PyTorch、TensorFlow等主流框架，以及transformers库。

4.有较宽的技术视野和钻研精神，主观能动性和学习能力强，能适应快速变化的技术趋势，具备良好的团队合作精神和沟通技巧。

具备以下者优先

有AI解决方案、产品应用（GUI Agent、RAG、RPA等）背景

岗位亮点

1.技术应用场景丰富，与业务深度协同。

2.以公司实际业务为依托，有完善的技术转化和落地机制。

3.在快速发展的领域中，积累丰富的经验，成为视觉内容理解领域的专家。

查看更多职位描述

以担保或任何理由索取财物，扣押证照，均涉嫌违法，请提高警惕

北京三快在线科技有限公司

互联网

1000-9999人 | 上市公司

为您推荐更多相似职位

2-2.5万

北京硕士

8-16万

北京本科

1.5-2万

北京本科

2-3万

北京硕士

【快Star-X】GenAI异构计算架构与优化工程师

面议

北京硕士

1-2万

北京本科

周边城市

查看更多相似职位

工作地址

职位描述

职位福利

北京三快在线科技有限公司