职位描述
岗位职责:
1. 数据标准与模型治理
• 建立并维护数据分层(ODS/DWD/DWS/ADS 等)、命名规范、字段标准、枚举值与口径定义;
• 推动主题域/公共维度/主数据(如车型、版本、区域、VIN 等)统一,减少重复建设与口径冲突。
2. 元数据、血缘与资产管理
• 维护数据目录/数据字典,补全表/字段说明、owner、生命周期、SLA 等;
• 建立核心链路血缘(采集→入湖/仓→加工→指标/报表),支持问题追溯与影响分析;
• 形成数据资产清单与复用机制(公共表、公共指标、公共口径)。
3. 数据质量治理与监控
• 设计并落地数据质量规则体系(完整性、唯一性、及时性、准确性、一致性、波动性等);
• 建设质量监控看板与告警闭环(发现→定位→修复→复盘→预防),输出月度质量报告;
• 对关键链路建立 SLO/SLA(如 T+0/T+1 产出、延迟 P95、缺失率阈值等)。
4. 权限与合规治理
• 按最小权限原则梳理数据分级分类、访问审批、脱敏与审计策略;
• 配合安全/法务/审计要求,落实数据留存、删除、共享与外部交付规范。
5. 治理运营与交付协同
• 对接数据研发、算法、产品、运维等团队,推动治理需求进入迭代,形成 PRD/任务拆解与验收标准;
• 输出可复用文档与培训材料(规范、模板、操作手册),提升团队自驱治理能力。
任职要求:
• 3 年及以上数据治理/数据平台/数据仓库相关经验(外包可接受但需具备可落地交付能力);
• 熟练使用 SQL(Hive/Presto/Trino/MySQL 任一),能独立完成数据探查、对账与异常定位;
• 理解数据仓库分层建模、指标体系与口径管理方法;
• 有数据质量规则/监控告警/问题闭环经验(能给出真实案例更佳);
• 具备良好的文档化与跨团队沟通能力,能推动规范落地而非只“写规范”。
加分项(满足任一即可)
• 使用过数据治理/资产平台:DataWorks、Atlas、Amundsen、DataHub、Collibra、Alation 等;
• 熟悉实时/离线链路:Kafka/Flink/Spark、湖仓(Hudi/Iceberg/Delta)、Airflow/DolphinScheduler;
• 具备权限与合规实践:数据分级分类、脱敏、行列级权限、审计;
• 有车联网/智能驾驶/日志数据治理经验(高维、多源、强时序、版本复杂)。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕