岗位职责:
1、深入了解主流图像和视频模型,紧密结合C端用户需求以及公司现有基础设施,制定合理的模型部署方案;
2、搭建并维护适配图像和视频生成AI模型部署的服务器环境,实现模型在C端应用中的快速部署与灵活迁移,大幅提升资源利用率,有效降低部署成本;
3、深度分析模型性能表现,对模型实施针对性优化与调优,显著提高模型推理速度,优化资源利用效率,熟悉各种并行策略,熟悉各种高效注意力机制、多GPU推理调度策略,优化显存碎片管理与计算资源利用率;
4、密切关注图像和视频生成AI模型部署领域的前沿技术发展趋势,积极开展新技术、新方法的研究与探索,为公司C端应用的模型部署工作引入创新思路与解决方案,提升产品竞争力。
岗位要求:
1、统招本科及以上学历,计算机相关专业优先,具备实际项目AI模型部署成功经验;
2、熟练掌握TensorFlow/Pytorch等至少一种深度学习框架,熟悉C++或Python编程语言;
3、熟悉各种并行策略,熟悉各种高效注意力机制、多GPU推理调度策略;
4、自驱力强,有较高的技术追求,较好的团队协作意识。