基础研发平台是美团的核心技术平台,立足于“零售+科技”的战略定位,通过打造人工智能、大数据、云计算、安全等核心技术能力,以及研发效能平台、企业应用平台等公共服务,为业务提供稳定安全、扩展易用、技术领先的平台技术和产品服务。
在这里,我们会参与到最前沿的技术研发和探索;能够接触超规模集群、海量数据,挑战高复杂业务场景,有机会与业界一流的工程师一起并肩前行。
在这里,我们有超强的技术氛围,持续向社区贡献业界实践,加速行业技术发展;我们有完善的互联网学习生态圈,重视底层逻辑和方法论,助力职业生涯的非线性成长。
真诚地邀请你,和我们一起驱动技术发展,创造行业价值。
岗位职责
1. 深入参与美团 GenAI 大规模基础设施建设
2. 负责美团大规模基座模型训练框架架构迭代,稳定性、易用性、可运维能力和可观测能力建设
3. 负责高达数万卡规模和数万亿参数的大规模训练性能优化
岗位基本需求
1. 有扎实的计算机理论基础,熟练掌握C++或Python语言
2. 熟悉CUDA或NPU编程经验优先,有RDMA实践经验优先
3. 深入了解PyTorch 或 TensorFlow等引擎的架构和运行原理,有深度定制经验优先
4. 有Megatron-LM、DeepSpeed 等大模型训练框架的优化经验优先
5. 深入理解大模型训练多维并行并行架构,如Tensor 并行、流水线并行、序列并行等
6. 深入理解Transformer 类模型结构,如BERT、GPT 、ViT等
7. 学习能力和好奇心强,具备良好的沟通协调能力与团队协作精神
具备以下者优先
1.有大模型相关算法研究经验优先,欢迎算法转工程
2.有大规模分布式系统、高性能网络研发、高性能计算相关经验优先
3.业界头部规模的计算集群,海量数据和丰富的应用场景,挑战与机遇并存。
岗位亮点
业界前列的算力规模、海量数据和丰富的应用场景,深入协同算法团队深度参与大模型项目,共同探索Scaling Law 边界。