职位详情
视觉内容理解大模型算法工程师 已下线
面议
北京三快在线科技有限公司
北京
1年以下
硕士
06-26
工作地址

望京

职位描述
基础研发平台是美团的核心技术平台,立足于“零售+科技”的战略定位,通过打造人工智能、大数据、云计算、安全等核心技术能力,以及研发效能平台、企业应用平台等公共服务,为业务提供稳定安全、扩展易用、技术领先的平台技术和产品服务。

在这里,我们会参与到最前沿的技术研发和探索;能够接触超规模集群、海量数据,挑战高复杂业务场景,有机会与业界一流的工程师一起并肩前行。

在这里,我们有超强的技术氛围,持续向社区贡献业界实践,加速行业技术发展;我们有完善的互联网学习生态圈,重视底层逻辑和方法论,助力职业生涯的非线性成长。

真诚地邀请你,和我们一起驱动技术发展,创造行业价值。

岗位职责

1.基于多模态大模型技术,提升富文本图像、视频内容的端到端解析理解能力,如行业文档图像、电商场景图像、屏幕录制图像视频等。

2.推进建设大模型产品解决方案,推动相关算法在业务场景中落地,赋能商家入驻、企业办公、风控合规、自动化测试等业务的智能化升级。

3.负责包含但不限于优化多模态大模型的图文理解能力、协同大模型相关产品建设、服务部署落地全流程、构建流程自动化系统等。

岗位基本需求

1.具有一年以上多模态大模型算法研发经历,参与过模型训练、调优、部署等,计算机相关专业硕士及以上学历。

2.在以下领域有较深入的研究经验,包括但不限于:图像/视频分类和识别、文字识别、目标检测、图像分割。

3.在机器学习和深度学习方面具备扎实的理论基础和工程能力,熟悉PyTorch、TensorFlow等主流框架,以及transformers库。

4.有较宽的技术视野和钻研精神,主观能动性和学习能力强,能适应快速变化的技术趋势,具备良好的团队合作精神和沟通技巧。

具备以下者优先

有AI解决方案、产品应用(GUI Agent、RAG、RPA等)背景

岗位亮点

1.技术应用场景丰富,与业务深度协同。

2.以公司实际业务为依托,有完善的技术转化和落地机制。

3.在快速发展的领域中,积累丰富的经验,成为视觉内容理解领域的专家。

查看更多职位描述

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

查看更多相似职位