职位描述
关键词:
CUDA/Megatron/训练/工具链/LLM推理/Profiler/Profiling/算子开发
华为昇腾芯片,od经验优先
工作地点:
北京海淀区/朝阳区,大概率海淀区(驻场客户,具体位置和客户名字面试的时候和面试官沟通)
级别&薪资:
初级1个:资质要硬性条件,可培养性强,15-18K
中级2个:2-6年,主力干活,有类似项目经验,18-24K
高级2个:6年以上,24-31K
能力要求:
1.扎实的编程功底,善于总结与分享,自驱学习,主动闭环任务,具备较好的客户服务意识,表达能力强者优先
专业技能(满足1-2项能力即可参与面试,具备多项能力优先考虑):
1.了解PyTorch,熟悉vLLM、SGLang等大模型推理框架,或者Megatron、DeepSpeed等训练加速框架;
2.了解主流大模型算法、熟悉大模型推理优化方法或者常见训练微调加速方式;
3.掌握性能、精度Profiling方法论及工具,有实际Profiling经验优先;
4.熟悉C++或Python编程语言开发,具备较好的计算机体系架构及操作系统知识。了解CUDA编程、Triton Language编程优先;
5.了解NCCL、Gloo等通信库原理,有实际开发优化经验者优先;
工作内容:
1.分析、解决框架移植、模型适配、算子适配、通信库适配、Runtime驱动适配等软件开发过程中遇到的问题,跟进问题的解决进程,端到端完成对客户及合作伙伴的交付;
2.与重点合作机构及伙伴协同,围绕昆仑芯软硬件产品与伙伴软件栈开展需求的调研、开发、测试、总结、报告、知识文档化、内部分享等工作;
3.对接客户及合作伙伴接口人,按需完成驻场开发任务,完成客户及伙伴指定的任务,保障客户及伙伴满意度;
差旅相关:
1.需要去往base地的客户现场驻场开发。
2.可能的差旅目标城市:北京、上海、深圳、杭州、西安、南京、广州、南宁、济南;
3.base地之外的出差频率:每季度1-3次,根据项目阶段性要求出差;
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕