面议
中国科学院工业人工智能研究所
1. 参与AI算子开发与优化,实现深度学习模型中的核心计算算子,针对不同硬件平台(如GPU/NPU/CPU/DSP)进行性能优化,提升计算效率;
2. 针对国产加速设备设计深度学习高性能算子方案,完成功能研发及适配优化,保障硬件算力高效释放;
3. 负责算子与主流AI框架(如PyTorch、TensorFlow、Caffe等)的集成,完成功能验证、性能测试及稳定性保障,确保算子稳定运行;
4. 设计并开发算子自测试用例,搭建功能和性能分析工具,提升算子库开发效率与质量;
5. 整理技术文档、优化记录及开发文档,协助团队解决算子相关技术问题,支持模型部署、调优及工程落地。
任职资格
1. 计算机、人工智能等相关领域硕士及以上学历,具备扎实的C/C++/Python编程能力;
2. 良好的算法基础,熟悉时间复杂度、空间复杂度分析,掌握软件Debug技巧,能高效定位并解决问题;
3. 理解深度学习理论,熟悉PyTorch、TensorFlow等至少一种开源深度学习框架,了解框架底层算子运行机制;
4. 有CPU/GPU/NPU等硬件平台底层函数库开发或性能优化经验,熟悉图优化、算子融合等性能优化方法者优先;
5. 具备较强的快速学习能力、团队合作能力及沟通能力,能适应跨团队协作场景。
加分项
1. 有汇编优化、CUDA、TensorRT、OpenCL、MPI并行计算或HPC开发经验;
2. 有国产加速设备算子开发或适配经验,或推理引擎(如TVM)实现原理相关经验;
3. 有深度学习领域(目标检测、机器视觉等)工程落地经验;
4. 具备RDMA、DSP、FPGA等硬件编程或优化经验。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕