职位详情
大模型后训练架构工程师/专家
面议
北京三快在线科技有限公司
北京
1-3年
本科
05-02
工作地址

美团

职位描述
基础研发平台是美团的核心技术平台,立足于“零售+科技”的战略定位,通过打造人工智能、大数据、云计算、安全等核心技术能力,以及研发效能平台、企业应用平台等公共服务,为业务提供稳定安全、扩展易用、技术领先的平台技术和产品服务。

在这里,我们会参与到最前沿的技术研发和探索;能够接触超规模集群、海量数据,挑战高复杂业务场景,有机会与业界一流的工程师一起并肩前行。

在这里,我们有超强的技术氛围,持续向社区贡献业界实践,加速行业技术发展;我们有完善的互联网学习生态圈,重视底层逻辑和方法论,助力职业生涯的非线性成长。

真诚地邀请你,和我们一起驱动技术发展,创造行业价值。

岗位职责

1.负责文本、多模态等大模型后训练(微调/强化学习)能力建设,包括:训练框架研发、开源模型适配、训练成本优化、训练效果调优等。

2.协同产运、算法团队,推动后训练技术落地业务。

3.与团队其他成员密切合作,共同解决技术难题,推动团队整体技术提升。

岗位基本需求

1.有扎实的计算机理论基础;熟练掌握常用数据结构和算法;熟练掌握C++或Python 等语言

2.熟悉transformer类模型结构,熟悉GQA、MLA、MoE等模块,熟悉常用的深度学习框架和工具;

3.具备较强的逻辑思维能力,善于分析、归纳、描述、沟通和解决问题。

4.责任心强,做事认真负责,owner 意识强。

具备以下者优先

1.有大模型微调/强化学习(SFT、DPO、PPO、GRPO、Distill等)工作经验,有训练框架开发经验 ;

2.学习能力强,动手能力强,有较强的自驱力,对大模型有一定的热情。

岗位亮点

1.大模型研发核心团队,涉及模型选型、训练、调优到部署上线全栈技术;

2.影响力广泛:模型落地直接赋能美团业务,影响千万用户。

3.灵活的工作环境和创新的团队文化,支持个人成长与发展。

4.提供内部和外部的培训机会,不断提升技术能力。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请