岗位职责:
一、核心技术研发
1、主导视频大模型全周期开发(预训练/微调/推理),设计高效模型架构(如Diffusion/Transformer混合结构),优化训练策略与超参数调优;
2、突破多模态对齐技术难点,开发文本/图像/视频跨模态生成算法,提升生成内容的时序连贯性与物理合理性;
3、构建分布式训练框架,实现显存优化、梯度压缩等加速技术,完成千卡级集群的高效资源调度。
二、技术战略与小组统筹
制定文生视频(Text-to-Video)技术路线图,攻克高分辨率(4K+)、长视频(>1分钟)生成等工业级难题,能够统筹算法攻坚小组,协调模型研发、工程部署与产品落地的全流程协作。
三、行业前沿洞察
跟踪全球AIGC技术趋势(如Sora、Runway ML等),保持技术领先性,制定专利与论文策略。
任职要求:
必备条件
1.计算机、人工智能、数学等相关专业的博士(优先)、研究生学历
2.5年及以上AI/计算机视觉/多模态生成领域经验,**至少2年AIGC项目(文生视频/图生视频)攻坚和统筹经验。
3.大厂背景:曾在国内外一线科技公司(如Google、Meta、字节、腾讯、阿里等)主导过AIGC相关项目。
4.精通生成模型技术栈(如Stable Diffusion、GANs、VAEs、Nerf等),熟悉视频生成领域的挑战(如时序一致性、物理合理性)。
5.强大的工程落地能力,熟悉分布式训练、推理加速及云端部署。
优先条件
1.有AI视频生成商业化落地经验(如影视特效、广告生成、UGC工具等)。
2.在顶会(CVPR、ICML、NeurIPS等)发表过相关论文,或主导过开源项目。
3.熟悉AIGC行业生态,具备供应商、合作伙伴资源整合能力。