基础研发平台是美团的核心技术平台,立足于“零售+科技”的战略定位,通过打造人工智能、大数据、云计算、安全等核心技术能力,以及研发效能平台、企业应用平台等公共服务,为业务提供稳定安全、扩展易用、技术领先的平台技术和产品服务。
在这里,我们会参与到最前沿的技术研发和探索;能够接触超规模集群、海量数据,挑战高复杂业务场景,有机会与业界一流的工程师一起并肩前行。
在这里,我们有超强的技术氛围,持续向社区贡献业界实践,加速行业技术发展;我们有完善的互联网学习生态圈,重视底层逻辑和方法论,助力职业生涯的非线性成长。
真诚地邀请你,和我们一起驱动技术发展,创造行业价值。
岗位职责
参与Agentic RL系统的工程研究和落地,工作包括/不限于:Agentic RL系统部分功能的设计和实现、RL性能优化、RL算法实现、数据合成链路设计和实现等
跟进公司内外AI Agent方向的技术演进,进行Agentic RL相关的技术调研。
岗位基本需求
硕士及以上学历,计算机及相关专业;
熟悉机器学习基础,对Transformer模型原理、强化学习原理有深入了解;
有强化学习框架开发经验,有训练框架如Megatron、推理框架如SGLang/vLLM开发经验;
熟悉Ray等分布式框架;
熟悉Python/C++开发,熟悉异步编程;扎实的编程能力,熟悉算法和数据结构,熟悉计算机基础理论。
具备以下者优先
在大语言模型、基础模型、世界模型、强化学习等方向,参与过开源、大影响力项目者优先。
岗位亮点
有机会接触业界前沿AI技术,提升专业能力。
参与大型项目的开发,获得实战经验。