职位详情
大模型应用与多媒体数据库开发实习生
6000-10000元
浙江长安仁恒科技股份有限公司上海分公司
杭州
不限
本科
04-15
工作地址

海运国际大厦A座

职位描述

岗位职责


1. 多模态数据库搭建与优化

设计并实现支持文字、图片、视频的结构化数据库架构,优化存储与检索效率。

• 开发自动化数据清洗工具,对外部来源的图片/视频进行格式标准化与元数据提取。

• 构建脱敏处理流程,通过哈希加密、敏感信息模糊化等技术规避侵权风险。

2. 无标识视频批量标注系统开发

• 基于大模型(如GPT-4V、CLIP)开发多模态标注工具,实现视频关键帧提取、物体识别与语义标签生成。

• 设计标注质量校验算法,结合主动学习机制提升标注精度至99%以上。

3. 素材生成引擎研发

• 利用扩散模型(如Stable Diffusion)与企业私有数据微调生成式AI,定制化输出符合品牌风格的图片/视频。

• 开发素材检索接口,支持语义匹配(如“科技感蓝色背景”)与风格迁移功能。


任职要求


1. 核心能力

• 985/211 计算机相关专业在读,熟悉Python/C++,具备扎实的算法与数据结构基础。

• 有大模型实战经验,掌握至少一种主流框架(如PyTorch、Hugging Face)及多模态处理技术。

• 熟悉数据库开发流程,能使用SQL/NoSQL工具进行数据建模与性能调优。

2. 加分项

• 参与过开源数据库项目(如Apache HoraeDB)或Kaggle多模态竞赛。

• 熟悉视频处理库(FFmpeg/OpenCV)及分布式计算框架(Spark/Dask)。

• 具备知识产权合规意识,了解《网络安全法》《数据安全法》相关条款。



以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请