职位描述
任职资格
1、教育背景:
计算机、人工智能、通信或电子相关专业本科及以上学历。
2、有1年以上大模型研发经验,熟悉预训练、指令微调、RLHF等流程与框架。
3、有大模型训练和调优经验,熟悉分布式和混合精度训练基本方法与框架。
技术技能:
1、精通深度学习算法、NLP(自然语言处理)、CV(计算机视觉)和多模态等大模型网络结构和原理。
2、熟悉Transformer等模型架构,对GPT系列、LLAMA系列和MoE等模型架构有深入理解并拥有大规模训练经验。
3、熟练掌握Python、Java等至少一种编程语言,熟悉PyTorch、Tensorflow等深度学习框架。
4、具备良好的算法和数学理论基础,熟悉自然语言处理、生成式AI和机器学习等技术。
其他能力:
1、目标感强,善于分析和发现问题,拆解简化,有想法并乐于挑战自我。
2、条理性强且有推动力,能够梳理繁杂的工作并建立有效机制,推动上下游配合完成目标。
3、具有较强的组织、沟通、协调和抗压能力,以及高度的责任感和团队合作精神。
工作内容
1、负责设计餐饮业AI大模型,并持续优化和迭代,提升模型的性能和准确性。
2、结合业务需求,对大模型进行定制化和个性化开发,以满足不同场景的需求。
团队协作:
3、与产品、研发、销售等部门紧密合作,共同推动项目的进展和落地。
4、参与跨部门的技术交流和培训,提升团队整体的技术水平和能力。
5、跟踪重点场景解决方案架构设计,规划布局并负责项目进度管理及产品研发实现。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕