工作职责:
1、负责自动驾驶领域数据湖仓体系的建设与优化,实现多模态数据的统一管理与调度;
2、设计数据模型、元数据管理、版本追溯与数据血缘体系;
3、搭建高效的数据ETL/ELT流程,支持清洗、统计、特征抽取与数据供给;
4、推动数据治理与标准化,建设可追溯、可分析的数据资产体系;
5、支撑算法与模型团队的数据分析与挖掘任务。
教育背景:本科以上学历(不限学校层级),性别年龄不限
专业要求(次):计算机、电子工程、自动化、人工智能等相关专业
学历+学位证书:双证必备
工作地址:广州总部、北京(筹备中)、上海(筹备中)均可
工作经验要求:3年以上(只看自动驾驶量产车/产品经验)
1、熟悉大数据生态(Spark、Flink、Hive、Hudi、Iceberg、Delta Lake 等);
2、精通 SQL 与数据建模,熟悉湖仓一体架构与数据治理;
3、熟练使用 Python(Pandas、PySpark)进行数据处理与分析;
4、具备扎实的性能调优与工程化能力,熟悉AI coding工具的使用。