1-1.5万
零次方机器人(深圳)有限公司
构建高质量、大规模、多模态的具身智能训练数据集,为机器人智能系统提供坚实的数据基础,推动具身智能技术的突破与应用落地。
设计并搭建多模态数据采集平台,整合视觉、语音、力觉、惯导等多传感器数据
开发机器人操作轨迹数据采集系统,支持示教学习与自主探索数据收集
构建仿真环境大规模数据自动生成框架,程序化生成多样化训练场景
设计数据采集协议与标准,确保数据质量与一致性
构建高吞吐、低延迟的数据处理管道,支持TB级数据的实时处理与流转
开发分布式数据存储与管理系统,优化海量数据的存取性能与成本
设计数据版本控制与溯源机制,保障实验的可复现性与数据完整性
建立数据安全与隐私保护体系,符合公司安全规范与行业标准
制定具身智能专用标注规范,涵盖行为分割、意图识别、轨迹标注等维度
研发智能化标注工具链,提升标注效率与准确性
建立多级质量检验流程,包括自动校验、人工复核、抽样审计等
管理标注团队工作流程,持续优化标注产能与质量
分析模型训练需求,设计针对性的数据集构成与分布策略
策划数据集的场景多样性、任务复杂度、数据平衡性等关键特性
实施数据增强与合成技术,扩展数据集的覆盖范围与规模
构建基准测试数据集,支持模型能力评估与对比分析
开发数据质量评估体系,建立数据健康度监控指标
分析数据分布特征,识别数据偏差、噪声与缺失问题
建立数据与模型表现的关联分析,指导数据采集方向优化
产出数据洞察报告,为技术决策提供数据支持
计算机科学、数据科学、机器人学等相关专业本科及以上学历
3年以上数据工程、大数据开发或相关领域工作经验
精通Python数据处理栈(Pandas, NumPy, PySpark等)
熟练掌握SQL/NoSQL数据库与大数据技术生态
具备完整的数据管道开发与运维经验
优秀的编程能力与系统设计能力
核心技能:
数据管道工具:Airflow, Kubeflow, Prefect等
大数据平台:Spark, Hadoop, Flink等
数据存储:MySQL, MongoDB, Redis, HBase等
云平台服务:AWS S3/Glue, Azure Data Factory, GCP BigQuery等
优先考虑:
有ROS/ROS2机器人数据(bag文件)处理经验
熟悉仿真环境(Isaac Sim, MuJoCo, Unity)数据导出与处理
具备多模态数据(点云、图像、IMU等)融合处理经验
了解机器学习数据需求与数据增强技术
有数据标注平台或工具开发经验
严谨细致的工作态度,对数据质量有极高要求
优秀的问题分析与解决能力,能够处理复杂数据工程挑战
良好的团队协作与沟通能力,能够跨部门协调资源
强烈的责任心与质量意识,注重细节与规范性
积极主动的学习态度,能够快速掌握新技术
具有竞争力的薪资水平
年度绩效奖金与项目奖金
股权激励计划(核心岗位)
五险一金+补充商业保险
年度健康体检与健康管理
带薪年假与弹性工作制
技术培训与职业发展支持
团队建设与文化活动
业界领先的计算资源与数据基础设施
与顶尖技术团队共事的学习成长机会
参与前沿技术研发与产品落地的完整流程
开放包容的技术氛围与创新文化
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕