职位详情
AI 数据工程师
2-3.5万
中数元宇数字科技(上海)有限公司
上海
3-5年
本科
01-07
工作地址

张江科学之门-A塔43层

职位描述

建立“从双目输入到训练数据集到回归门禁 ”的全链路基础设施:标定同步可信、录制回放可复现、数据集格式统一可训练。

职责

1. 设计并实施面向 MR 眼镜多模态数据采集,涵盖传感器数据(摄像头,TOF 及交互行为数据和环境语义信息)

2. (验收传感器数据)双目标定/同步/校正输出(RectifiedStereoFrame),TOF 及 6DOF 数据

3. 指定数据质量评估体系(如标注准确率,场景覆盖率,分布均衡性),通过自动化校验(规则引擎,异常检查)和人工抽样审核保障数据的有效性

4. 和算法团队深度协作,将模型需求(多模态对齐,长尾场景挖掘)转换为可执行采集数据(合成数据生成)

5. 数据标注与增强(和标注相关团队合作,指定标注规范,确保标注一致性)

6. 支持算法研发,为手势算法及相关视觉技术团队提供高质量数据集,设计录制包标准(Recording Spec)与跨设备录制工具(眼镜端/手机端) ,回放评测(Replay/ Benchmark)与回归门禁(nightly/ PR gate),数据集收集与制作:多来源数据(RK/高通/手机/外部数据集)统一转换到 Dataset Spec ,数据版本与泄漏防护:split 规则、增强隔离、抽检与标注流程对接

7. 跨团队合作,与硬件团队,软件团队,算法团队合作,确保数据流和系统架构集成

学历:

计算机科学,软件工程,数据科学或相关专业,本科以上学历

技能:

具备 3 年 AI 数据产品相关工作经验,有算法研究或与算法团队直接沟通对接经验者优先

熟悉 AI 模型研发全流程(数据准备-模型训练-评估-部署),了解常见机器学习/深度学习模型(如 CNN 、RNN 、Transformer 等)的数据需求特点

熟练掌握 Python 编程语言及数据库 SQL 语言,了解 Json 、Markdown 、HTML 等数据格式熟悉 linux 环境和系统运维,脚本开发经验

经验:

2 年以上 MR 眼镜及视觉相关行业数据相关工作经验有数据质量管理和问题排查经验

对于数据处理,合成数据生成有深刻理解沟通协作能力,能够跨团队高效沟通

独立思考和解决复杂技术问题的能力

加分:

有过 MR 眼镜传感器数据集评估,采集处理相关经验


以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请