岗位职责:
1.负责多模态大模型的预训练、微调及性能优化,提升模型在文本、图像等跨模态场景的融合能力;
2.设计并开发多模态生成式AI算法,实现模型在人机交互、内容理解等领域的实际应用落地;聚焦智能体流程中关键节点(如图像识别与问答、视觉文本联合推理、场景理解等),开发对应的算法模型或能力模块;
3.负责跟踪学术界与工业界前沿技术动态,开展模型结构创新及轻量化技术研究(如量化、剪枝等),减少模型幻觉问题;
4.负责构建多模态数据清洗、标注及增强标准流程,优化训练数据集质量,提升模型泛化能力;
5.负责模型框架设计与部署,负责算法模型在移动端或云端的推理优化;
6.负责算法的国产化硬件和框架迁移适配工作;
7.与产品、后端、前端、UI 等团队密切配合,将算法成果转化为用户可感知的能力服务,协助推动智能体产品整体演进;
8.完成领导交办的其他工作任务。
岗位任职条件:
1.工作经历:
(1)具有2年及以上算法开发经验;
(2)熟悉机器学习、深度学习、预训练、微调、RLHF全流程者优先;
(3)有2年以上多模态大模型研发经验者优先、有百亿级参数模型训练或轻量化部署经验者优先;
(4)具有互联网大厂算法开发经验或系统开发经验者优先。
2.能力要求:
(1)熟悉PyTorch/TensorFlow、paddlepaddle、mindspore等至少一种框架,能独立完成模型结构设计与分布式训练;
(2)熟练运用python进行开发;
(3)熟悉跨模态对齐、对比学习等算法;具备数据处理全链路能力,包括清洗、增强及多模态数据标注,熟悉文本清洗技术、熟悉transformers原理;熟悉linux系统、docker部署方法;
(4)具备良好的文档编写能力者优先,能够撰写清晰、准确的技术文档和解决方案报告者优先。
3.其他要求:
(1)工作态度积极进取,对工作保持高度热情;
(2)具有良好的抗压能力和责任心,积极主动以及具备高效的执行力。