岗位职责:
1.负责多模态图像大模型的预训练、微调与评估,包括LLM、Diffusion、Vision-Language模型等;
2.参与构建和优化模型训练数据集,包括文本、图像、图文对等;
3.负责训练框架的开发与优化,如分布式训练、混合精度训练、参数高效微调(LoRA、PEFT 等);
4.跟进前沿研究,推动模型性能优化和推理效率提升;
5.与产品、算法、后端等团队紧密合作,推动模型落地。
任职要求:
1.计算机、人工智能、图像处理、自然语言处理等相关专业本科及以上学历,优秀者可放宽;
2.熟悉大模型架构(如Transformer、Diffusion、CLIP、BLIP、SD等),并有实际训练经验;
3.熟练掌握 PyTorch、Transformers、Diffusers、DeepSpeed、Accelerate 等主流框架;
4.具备多模态数据处理与标注经验,有AIGC相关项目经验者优先;
5.具备良好的工程实现能力和团队协作精神;
6.有较强的英文文献阅读和技术文档撰写能力。
加分项:
1.有开源项目经验或在顶会发表论文;
2.了解 Stable Diffusion、SDXL、LLaVA、MiniGPT-4、InternLM-XComposer 等项目;
3.有AI绘图或文生图产品开发经验者优先。