岗位职责
1.模型部署:根据水下多种传感器(声纳、光学)数据特点,选择合适的多模态端到端大模型架构,以及Deepseek大模型,并将其部署于国产GPU硬件平台,确保模型能够满足实际应用的准确性和效率要求,实现多种传感数据的融合,输出所需检测与控制结果。
2.模型训练与优化:制定训练策略并调整模型参数,以提高模型的收敛速度和效果。
职位需求
1、学历与经验:硕士及以上学历,3年及以上相关工作经验。计算机视觉、自然语言处理或多模态方向背景优先;
2、学术背景:具备较强的学术调研能力,能快速理解和实现论文中的算法;有高质量论文发表、开源项目贡献、ACM竞赛或相关学术比赛获奖经历者优先;
3、深度学习能力:熟悉常见神经网络架构(Transformer),熟练掌握深度学习框架(如PyTorch、TensorFlow),有模型训练、压缩、蒸馏和微调经验;熟悉DeepSeek等模型优先;熟悉GPU加速等技术;
4、工程能力:具备优秀的独立开发与调试能力,熟悉Python服务开发,Hive大数据处理等技术;
5、团队协作:具备良好的沟通能力,乐于学习与分享,能够与团队高效协作解决问题。