职位描述
一、岗位需求:
1、能独立闭环专项算法研发的实战专家,强调工程化能力(代码/实验/部署全流程经验);
2、负责大语言模型关键技术攻关。
二、能力画像/专业要求:
1、深度参与过千亿/百亿参数级大模型全生命周期开发(数据-训练-微调-部署),具有一线实操经验;
2、熟悉预训练中的关键技术陷阱(如梯度爆炸、显存溢出、过拟合),掌握预训练调参黄金法则,掌握分布式训练优化策略(如ZeRO、Offload、PP, TP, SP)、掌握训练加速方案(混合精度/梯度累积);
3、熟悉分布式训练框架deepspeed, megatron和底层相关实现;
4、精通RLHF、长文本处理(如YaRN)、推理优化(Speculative Decoding)、P-D detach、数据增强策略(合成数据生成、对抗样本注入);精通模型架构改进(如MoE设计、FlashAttention优化)。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕