工作职责:
深入分析训练系统,定位和解决训练系统各个层次的性能瓶颈,不断提升训练效率,打造业界领先的训练系统,推进算法的高效迭代。如:
1. 面向AI推理场景的全局KVCache的多级轻量化存储计算,与PD分离相结合,推动整体推理性能提升;
2. 面向AI训推场景的通讯性能提升;
3. 优化推理速度、内存占用和能耗,支持多种硬件架构(GPU、NPU等 )
4. 模型量化, 剪枝, 编译
5. 申请并承担科研任务,发表高水平研究成果,推动项目合作。
任职资格:
1. 计算机、电子工程、自动控制等专业博士及以上学历;
2. 了解深度学习算法基本原理,熟悉CNN/Transformers等主流模型原理与CUDA、MPI、NCCL等相关底层原理;具有AutoML/模型推理/训练优化或AI 相关大模型/重要项目经验者优先;熟悉
3. 优秀的代码能力,熟练掌握C/C++或Python/CUDA等编程语言。
薪资:15-40K
工作地点:1。广东省东莞市南城区寰宇汇金中心9B33层;2.北京市海淀区知春路23号量子银座7层