1.5-2万
海运国际大厦A座
岗位职责
1. 多模态数据库搭建与优化
设计并实现支持文字、图片、视频的结构化数据库架构,优化存储与检索效率。
• 开发自动化数据清洗工具,对外部来源的图片/视频进行格式标准化与元数据提取。
• 构建脱敏处理流程,通过哈希加密、敏感信息模糊化等技术规避侵权风险。
2. 无标识视频批量标注系统开发
• 基于大模型(如GPT-4V、CLIP)开发多模态标注工具,实现视频关键帧提取、物体识别与语义标签生成。
• 设计标注质量校验算法,结合主动学习机制提升标注精度至99%以上。
3. 素材生成引擎研发
• 利用扩散模型(如Stable Diffusion)与企业私有数据微调生成式AI,定制化输出符合品牌风格的图片/视频。
• 开发素材检索接口,支持语义匹配(如“科技感蓝色背景”)与风格迁移功能。
任职要求
1. 核心能力
• 985/211 计算机相关专业在读,熟悉Python/C++,具备扎实的算法与数据结构基础。
• 有大模型实战经验,掌握至少一种主流框架(如PyTorch、Hugging Face)及多模态处理技术。
• 熟悉数据库开发流程,能使用SQL/NoSQL工具进行数据建模与性能调优。
2. 加分项
• 参与过开源数据库项目(如Apache HoraeDB)或Kaggle多模态竞赛。
• 熟悉视频处理库(FFmpeg/OpenCV)及分布式计算框架(Spark/Dask)。
• 具备知识产权合规意识,了解《网络安全法》《数据安全法》相关条款。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕