职位描述
岗位职责
1.负责非结构化数据(文本、图像、音频、视频等)的采集、清洗、存储与预处理。
2.搭建与维护数据处理管道,支持实时流式处理和批处理。
3.对接 AI 模型推理服务,完成数据接口设计与服务化部署。
4.优化数据处理效率和系统稳定性,保障平台可扩展性。
5.协助多模态 AI 工程师完成数据对齐与特征工程。
任职要求
1.精通 Java或 Python,具备多模态数据处理经验。
2.熟悉微服务框架(Spring Boot、FastAPI、gRPC 等)。
3.有基于openCV图像类开发经验、ASR语音类开发经验、ffmpeg视频处理类经验。
4.有Python或Java的通用文本处理能力,基于LLM的语境语义分析处理能力。
5.跟踪前沿 AI 技术(LLM、多模态大模型、RAG),并推动在项目中的应用。
6.了解对象存储(S3、MinIO)与向量数据库(Milvus、Weaviate、FAISS)。
7.具备良好的工程化能力,能独立完成数据处理流程的设计与实现。
8.有做过数据标注平台开发、非结构化数据处理经验。
有过Yolo自动标注经验优先。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕