职位详情
具身数据工程师
1.6-3万·14薪
合肥零次方机器人有限公司
深圳
3-5年
本科
10-30
工作地址

零次方机器人(深圳)有限公司

职位描述
岗位使命

构建高质量、大规模、多模态的具身智能训练数据集,为机器人智能系统提供坚实的数据基础,推动具身智能技术的突破与应用落地。


核心岗位职责
1、数据采集系统开发
  • 设计并搭建多模态数据采集平台,整合视觉、语音、力觉、惯导等多传感器数据

  • 开发机器人操作轨迹数据采集系统,支持示教学习与自主探索数据收集

  • 构建仿真环境大规模数据自动生成框架,程序化生成多样化训练场景

  • 设计数据采集协议与标准,确保数据质量与一致性

2、数据管道与工程架构
  • 构建高吞吐、低延迟的数据处理管道,支持TB级数据的实时处理与流转

  • 开发分布式数据存储与管理系统,优化海量数据的存取性能与成本

  • 设计数据版本控制与溯源机制,保障实验的可复现性与数据完整性

  • 建立数据安全与隐私保护体系,符合公司安全规范与行业标准

3、数据标注与质量体系
  • 制定具身智能专用标注规范,涵盖行为分割、意图识别、轨迹标注等维度

  • 研发智能化标注工具链,提升标注效率与准确性

  • 建立多级质量检验流程,包括自动校验、人工复核、抽样审计等

  • 管理标注团队工作流程,持续优化标注产能与质量

4、数据集构建与优化
  • 分析模型训练需求,设计针对性的数据集构成与分布策略

  • 策划数据集的场景多样性、任务复杂度、数据平衡性等关键特性

  • 实施数据增强与合成技术,扩展数据集的覆盖范围与规模

  • 构建基准测试数据集,支持模型能力评估与对比分析

5、数据分析与价值挖掘
  • 开发数据质量评估体系,建立数据健康度监控指标

  • 分析数据分布特征,识别数据偏差、噪声与缺失问题

  • 建立数据与模型表现的关联分析,指导数据采集方向优化

  • 产出数据洞察报告,为技术决策提供数据支持


任职资格要求
必备条件
  • 计算机科学、数据科学、机器人学等相关专业本科及以上学历

  • 3年以上数据工程、大数据开发或相关领域工作经验

  • 精通Python数据处理栈(Pandas, NumPy, PySpark等)

  • 熟练掌握SQL/NoSQL数据库与大数据技术生态

  • 具备完整的数据管道开发与运维经验

  • 优秀的编程能力与系统设计能力


技术专长

核心技能:

  • 数据管道工具:Airflow, Kubeflow, Prefect等

  • 大数据平台:Spark, Hadoop, Flink等

  • 数据存储:MySQL, MongoDB, Redis, HBase等

  • 云平台服务:AWS S3/Glue, Azure Data Factory, GCP BigQuery等


优先考虑:

  • 有ROS/ROS2机器人数据(bag文件)处理经验

  • 熟悉仿真环境(Isaac Sim, MuJoCo, Unity)数据导出与处理

  • 具备多模态数据(点云、图像、IMU等)融合处理经验

  • 了解机器学习数据需求与数据增强技术

  • 有数据标注平台或工具开发经验


能力素质
  • 严谨细致的工作态度,对数据质量有极高要求

  • 优秀的问题分析与解决能力,能够处理复杂数据工程挑战

  • 良好的团队协作与沟通能力,能够跨部门协调资源

  • 强烈的责任心与质量意识,注重细节与规范性

  • 积极主动的学习态度,能够快速掌握新技术


薪酬福利薪酬待遇
  • 具有竞争力的薪资水平

  • 年度绩效奖金与项目奖金

  • 股权激励计划(核心岗位)


福利保障
  • 五险一金+补充商业保险

  • 年度健康体检与健康管理

  • 带薪年假与弹性工作制

  • 技术培训与职业发展支持

  • 团队建设与文化活动


工作环境
  • 业界领先的计算资源与数据基础设施

  • 与顶尖技术团队共事的学习成长机会

  • 参与前沿技术研发与产品落地的完整流程

  • 开放包容的技术氛围与创新文化

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请