职位详情
【快Star-X】GenAI异构计算架构与优化工程师
面议
北京达佳互联信息技术有限公司
北京
无经验
硕士
06-25
工作地址

快手总部·元中心

职位描述
职位描述:
1、负责异构计算芯片(GPU/NPU/ASIC等)的评估、选型与深度优化,构建面向业务场景的算力评估体系。
2、主导AI推理引擎在目标芯片上的设计与实现,实现毫秒级低延迟与高吞吐推理能力。
3、优化大规模模型训练框架的设计与实现,提升分布式训练效率,缩短模型迭代周期。
4、开发高性能算子库,突破芯片算力瓶颈,最大化硬件利用率。
5、推动异构编程范式革新,降低模型迁移成本,提升开发效率。
任职要求:
1、技术能力:
精通Linux环境下C/C++和Python开发,扎实的计算机体系结构、操作系统、编译原理基础。
深入理解深度学习框架底层实现(如TensorFlow/PyTorch的计算图优化、运行时调度等)。
熟悉至少一种主流异构计算架构(如NVIDIA CUDA、AMD ROCm、Google TPU等)及其编程模型。
具备高性能算子开发、模型训练/推理优化经验者优先。
2、经验背景:
在AI芯片评估、模型优化、高性能计算等领域有实际项目经验。
有顶级会议(ASPLOS、ISCA、MLSys等)论文发表或AI编译器技术(MLIR、TVM等)研究经验者优先。
3、综合素质:
具备优秀的算法思维、系统架构设计能力与工程实现能力。
对AI技术前沿有强烈兴趣,能快速学习并解决复杂技术问题。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

在线网申