基础研发平台是美团的核心技术平台,立足于“零售+科技”的战略定位,通过打造人工智能、大数据、云计算、安全等核心技术能力,以及研发效能平台、企业应用平台等公共服务,为业务提供稳定安全、扩展易用、技术领先的平台技术和产品服务。
在这里,我们会参与到最前沿的技术研发和探索;能够接触超规模集群、海量数据,挑战高复杂业务场景,有机会与业界一流的工程师一起并肩前行。
在这里,我们有超强的技术氛围,持续向社区贡献业界实践,加速行业技术发展;我们有完善的互联网学习生态圈,重视底层逻辑和方法论,助力职业生涯的非线性成长。
真诚地邀请你,和我们一起驱动技术发展,创造行业价值。
岗位职责
主要负责多模态大模型(不限于视觉/语音专家模型与全模态融合模型)的模型能力分析,并且对训练数据、策略和模型能力之间的关系进行研究分析,产出可行的模型评测方案和训练策略,具体工作内容包括但不限于:
1. 追踪多模态大模型方向的前沿进展,积极学习新的模型结构、前沿模型认知,并进行深入分析。
2. 积极探索业界前沿的生成与理解多模大模型进展,深入理解模型结构与训练过程,设定合理的模型训练效果分析方法和评测方案。
3. 结合评测结果,对模型的训练数据、策略和结构等进行深入分析,指导评测方案迭代以及训练策略优化。
4. 与各相关部门保持良好沟通,深度参与多模态模型的训练过程,共同推动多模态大模型持续优化。
岗位基本需求
1. 硕士及以上学历,计算机、数学、统计学或相关专业。
2. 熟悉Java/Python/C++等编程语言,良好的编码习惯和一定的工程能力 。
3. 具有视觉/语音算法的基础知识,熟练掌握多模态大模型相关算法和模型。
4. 良好的沟通能力、团队合作精神以及较强的问题解决能力。
5. 对每一行代码负责,对业务方负责,具备工匠精神。
具备以下者优先
1. 在计算机领域顶会(如CVPR、ECCV,ICCV,ACL,NeurIPS,AAAI等)上以一作发表过论文者优先。
2. 有视觉/语音等模态相关工作或算法研究经验者优先;
3. 对多模理解生成统一大模型有深入了解者优先;
岗位亮点
1. 紧跟人工智能行业进展,接触到前沿技术和行业趋势,磨练出对人工智能的独到见解;
2. 参与大模型的训练与评测的全流程,了解从理论到工程实践的全面技能;
3. 与一流的人工智能团队合作,快速成长,提升自身能力;
4. 有机会参与公司的创新项目,跨足不同领域,拓宽人工智能技术的应用范围;