职位描述
职位描述:团队主要聚焦视觉AIGC技术,我们期待你的工作将覆盖以下至少一个技术方向:
1、多模态数据的采集和处理,包括但不限于文/图/视频/音频数据的过滤、打标、分析、安全审查等;
2、基础生成模型相关技术研究,包括但不限于VAE、DiT、AutoRegressive Model等;
3、图像视频生成和编辑相关技术的开发和落地;
4、3D重建和3D生成算法;
5、模型的训练/微调/推理加速方法,包括但不限于模型训练效率提升、高效低成本微调、模型部署加速等;
6、语音相关的多模态能力的开发,包括但不限于TTS、文生音乐音效等相关技术的开发和落地。
任职要求:
1、硕士及以上学历,在以下方向至少有一年的科研或者工作经历:扩散模型、可控图像/视频的生成与编辑、3D生成、多模态理解、模型训练/推理加速;
2、在视觉和语音方向有过实际项目落地经验,发表过CV&AI顶会论文优先,ACM编程竞赛、人工智能竞赛、计算机视觉竞赛等竞赛获奖优先;
3、动手实现能力强,代码基本功扎实,精通基于C++或者Python的算法开发;熟练掌握pytorch/tensorflow/mxnet等至少一项深度学习框架;
4、责任心强、敢于承担、有激情、团队合作、沟通能力佳。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕