职位详情
大模型预训练架构工程师
面议
北京三快在线科技有限公司
北京
1-3年
本科
06-20
工作地址

恒电大厦

职位描述
基础研发平台是美团的核心技术平台,立足于“零售+科技”的战略定位,通过打造人工智能、大数据、云计算、安全等核心技术能力,以及研发效能平台、企业应用平台等公共服务,为业务提供稳定安全、扩展易用、技术领先的平台技术和产品服务。

在这里,我们会参与到最前沿的技术研发和探索;能够接触超规模集群、海量数据,挑战高复杂业务场景,有机会与业界一流的工程师一起并肩前行。

在这里,我们有超强的技术氛围,持续向社区贡献业界实践,加速行业技术发展;我们有完善的互联网学习生态圈,重视底层逻辑和方法论,助力职业生涯的非线性成长。

真诚地邀请你,和我们一起驱动技术发展,创造行业价值。

岗位职责

1. 深入参与美团 GenAI 大规模基础设施建设

2. 负责美团大规模基座模型训练框架架构迭代,稳定性、易用性、可运维能力和可观测能力建设

3. 负责高达数万卡规模和数万亿参数的大规模训练性能优化

岗位基本需求

1. 有扎实的计算机理论基础,熟练掌握C++或Python语言

2. 熟悉CUDA或NPU编程经验优先,有RDMA实践经验优先

3. 深入了解PyTorch 或 TensorFlow等引擎的架构和运行原理,有深度定制经验优先

4. 有Megatron-LM、DeepSpeed 等大模型训练框架的优化经验优先

5. 深入理解大模型训练多维并行并行架构,如Tensor 并行、流水线并行、序列并行等

6. 深入理解Transformer 类模型结构,如BERT、GPT 、ViT等

7. 学习能力和好奇心强,具备良好的沟通协调能力与团队协作精神

具备以下者优先

1.有大模型相关算法研究经验优先,欢迎算法转工程

2.有大规模分布式系统、高性能网络研发、高性能计算相关经验优先

3.业界头部规模的计算集群,海量数据和丰富的应用场景,挑战与机遇并存。

岗位亮点

业界前列的算力规模、海量数据和丰富的应用场景,深入协同算法团队深度参与大模型项目,共同探索Scaling Law 边界。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请