岗位职责:
1、负责GPU产品的通信库驱动和用户态并行计算驱动库开发;
2、负责互联拓扑方案的可行性分析,制定有竞争力的软件方案;
3、负责支撑集合通讯库在多机、多卡环境下的并行推理业务;
4、制定大模型场景中,大规模集群计算的集合通信方案;
5、同框架软件团队共同实现并行推理性能优化。
任职要求:
1、熟悉计算机体系结构及常见互联协议;
2、扎实的C/C++编程与调试能力,掌握大型Linux操作系统基本原理和概念;
3、熟悉GPGPU库相关功能,有在集群环境中的多卡多机通信经验者优先;
4、具备芯片互联和网络传输编程相关知识,熟悉RDMA、PCIe、CXL等方案,至少在其中一项中有开发经验;
5、拥有量产芯片的系统交付记录;
6、自我驱动,具备快速学习和较强的沟通能力。