职位描述
工作职责
(1) 设计企业级数据架构(实时数仓/湖仓一体);
(2) 构建自动化数据治理体系(血缘/质量/标准),制定 ETL 开
发规范;
(3) 攻克极端场景问题(千亿级数据去重/分钟级延迟保障)。
任职要求
(1) 本科及以上学历;
(2) 至少 5~8 年工作经验;
(3) 参与主导过 PB 级实时数仓建设;
(4) 5 年+超大规模数据管道经验,精通数据湖技术
(Iceberg/Hudi);
(5) 深度掌握分布式计算原理(SparkShuffle/FlinkCheckpoint);
(6) 优先以下人员,主导过 PB 级实时数仓建设,设计过跨集群数
据同步方案。具备成本优化能力(计算资源压缩 50%+),推
动自动化运维。熟悉数据安全合规方案(敏感数据脱敏/权限
分级);
(7) 语言要求不限。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕