【岗位职责】
1.数据清洗与预处理: 对多模态数据(如视觉、语言、动作指令等)进行清洗、格式化、去噪和归一化处理,使其符合模型训练要求。
2.数据标注与管理: 根据项目需求,组织或执行数据标注任务,制定标注规范,并对标注结果进行质量检查和验收。
3.数据流水线维护: 协助搭建和维护高效、可靠的数据处理流水线,确保数据能稳定、自动化地供给训练任务。
4.基础模型训练支持: 在算法工程师的指导下,执行标准的模型训练脚本,监控基础训练过程,并记录关键日志。
5.数据分析与报告: 对数据集进行初步的统计分析,生成数据质量报告,帮助团队理解数据特性与潜在问题。
【岗位职责】
1、本科及以上学历,计算机、软件工程、电子信息等相关专业优先。
2、至少2年 人工智能相关领域的工作经验,熟悉模型训练/数据清洗/数据标注中的至少一项核心工作。
3、具备扎实的Python编程能力,熟悉常用的数据处理库(如Pandas, NumPy)。
4、了解机器学习/深度学习的基本概念和流程(如训练/验证/测试集划分、过拟合、损失函数等)。
加分项:有接触或处理过机器人、自动驾驶、Embodied AI等相关领域数据(如图像序列、传感器数据、指令对)的经验。
了解常用的数据标注工具(如LabelImg, VGG Image Annotator等)或版本管理工具(如Git, DVC)。