职位描述
大模型部署实施工程师
工作职责
1.负责项目的模型部署工作,并具备开源项目的二次开发能力,按照公司需求进行定制。
2.负责各类模型在国产GPU上的适配工作。
3.负责国产GPU虚拟化技术验证实施工作。
4.参与大模型的量化压缩和推理加速工作,致力于实现极致速度和精度。
5.分析并解决模型部署中的性能瓶颈,同产品团队紧密协作推动大模型产品落地。
6.持续关注并探索新的部署、量化和加速技术,推动团队的技术创新。
任职要求
1.本科及以上学历,计算机科学、软件工程、自动化或相关专业。
2.熟悉常见国产算力卡的开发框架,如晟腾CANN。
3.熟悉常见开源模型的性能与算力需求,对开源模型选型,测试模型性能,持续优化部署方案,以提高模型的准确性和响应速度。
4.编程语言:熟练使用python编程,熟悉使用至少一种深度学习框架,如 pytorch、tensorflow等。
5.其他要求:有大型项目管理和团队管理经验者优先,具备国产服务器环境开发实施部署经验者优先,具有电力行业从业经验者优先
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕