岗位职责
规划和设计多模态系统整体架构;负责图文、视频、语音等子系统的模块化与接口设计;制定多模态数据预处理与标注流程;协调计算资源,优化训练与推理管道;推动跨团队协作,将多模态能力嵌入业务线;持续跟踪前沿技术,输出技术选型与可行性报告;指导团队进行模型评测、A/B 测试与迭代;制定部署、监控及故障应急方案。
任职要求
1.专业背景:计算机、数据科学、人工智能等相关专业。
2.学历要求:硕士学历及以上;本科学历如有优秀项目经验也可接受。
3.工作经验:至少 2 年相关项目经验,有重要项目突破经历可放宽至 1 年。
4.技能要求:熟练掌握深度学习框架(TensorFlow、PyTorch);理解图像、视频、语音及文本等多模态融合方法;熟悉 Transformer、视觉模型(ViT、Swin)与时序模型;掌握特征提取、对齐、交叉注意力等多模态技术;有大规模模型训练、分布式训练经验;熟练使用云原生平台(Kubernetes、Docker)。
工作地点:天津、杭州、珠海