工作职责:
1.负责多模态基础大模型的技术选型,框架设计和算法训练调优;
2.负责探索多模态大模型面向行业领域场景落地的方法论探索,根据行业需求进行数据分析和算法设计;
3.负责研究面向应用的多模态大模型和传统模型的融合机制;
4.跟踪多模态最新研究和算法,并利用其优化提升现有算法效果;
5.负责构建多模态基础大模型的中长期竞争力,并推动关键技术落地,实现技术综合竞争力领先,支撑商业落地。
任职资格:
1.人工智能,机器学习,计算机科学,图像处理等相关专业硕士及以上学历;
2.精通深度学习常用模型和算法,以及Pytorch等深度学习框架;
3.熟悉语言模型和多模态大模型基础原理,对Transformer,encoder,Diffusion,VAE等核心知识有深入了解和独特见解;
4.有丰富的多模态大模型设计,集群训练,微调经验;
5.曾主导过多模态图文理解方向项目研发,框架设计,产品开发和场景落地;
6.有顶级论文发表记录,或在大模型主流评测榜单上有进入前五的记录。