1、负责AI大模型的适配与开优化工作,包括模型性能分析与调优、识别和解决瓶颈问题;
2、负责AI大模型算子的优化和性能调优,确保模型在公司硬件平台上的高效稳定运行;
3、负责终端大模型部署和解决方案开发及适配,确保AI设备能够满足客户性能和功能需求
4、深入了解硬件架构及底层逻辑,与硬件团队紧密合作,实现软硬件协同优化;
5、跟踪最新的研究进展和技术趋势,提出改进和创新的想法。
任职要求:
1、计算机/通信/数学 本科、硕士,3年以上工作经验(本)/2年以上工作经验(硕士);
2、熟悉计算机系统体系架构,对软件性能优化加速有深入理解和实践经验。
3、了解并熟悉AI推理框架(如Onnx runtime\TensorRT等),成功部署过RNN、DNN、CNN、LTSM等模型且有实际使用经验者优先;
4、熟练使用至少一种主流AI框架(如TensorFlow、PyTorch、Mindspore等),并能高效进行模型开发与调试;
5、熟练掌握C/C++、Python编程语言,以及svn/git版本控制、CMake、Makefile等构建工具;
6、熟悉国产GPGPU/NPU及操作系统,有国产平台部署大模型应用开发经验者优先;
7、能独立完成售前解决方案,研制方案、研制总结及用户使用说明书的编写
8、工作扎实认真,善于与人沟通,具有团队合作精神。