岗位职责:
1. 针对不同端侧设备的硬件特性(CPU、GPU、NPU 等)进行模型适配;
2. 对大模型进行推理加速优化,优化软件对硬件的利用效率,降低软件的内存占用;
3. 与端侧芯片原厂合作,针对特定硬件架构和推理引擎进行模型优化,以实现最佳性能。
任职要求:
1. 计算机、自动化、计算数学、统计学等相关专业,硕士或以上学历,具备较好的计算机通用算法基础;
2. 熟悉并行计算框架,如 CUDA,OpenCL 等;
3. 熟悉 C++/Linux 等工具,及 TensorFlow、PyTorch 等深度学习框架;
4. 有深度学习模型推理实现经验优先;
5. 在高性能计算方向发表过高水平论文、获得过相关赛事奖项者优先;
6. 强烈的责任心和自我驱动力以及良好的沟通能力。
备注:本岗位投递有效期截止至2025.3.1,请求职者按照既定时间投递简历!