职位详情
大数据架构师
8000-10000元
河北鹏鹄信息科技有限公司
石家庄
3-5年
本科
08-20
工作地址

环球智汇中心-C座西塔23楼

职位描述

职责:

  1. 负责自研湖仓一体平台的总体设计与技术选型,构建统一的数据采集、存储、计算、查询与治理体系。
  2. 规划批流一体的数据处理架构:实时流处理可优先考虑 Apache Flink,其核心是真实流处理模型,能在数据到达时即时处理并提供严格的一次语义,适合低延迟场景 ;批处理可结合 Spark 等框架,采用云平台或 K8S 集群部署。
  3. 设计和推进数据模型(标签体系、领域模型),制定 ODS、DWD、DWS、ADS 分层策略,保证数据血缘、数据质量与数据资产目录。
  4. 建设统一的元数据管理、数据质量监控和安全治理体系,确保数据隐私与合规性。
  5. 带领团队完成需求拆解、任务分配、代码审核、上线和运维,协调与业务、算法团队的接口。

任职要求:

  • 计算机或相关专业本科及以上学历,3 年以上大数据平台设计与开发经验;具备交通/工业领域经验更佳。
  • 精通湖仓架构设计,熟悉 Apache Spark、Flink、Kafka 等生态,了解 Iceberg/Delta/Hudi 等开源表格式;能够根据业务选择合适的开源技术搭建批流一体平台。
  • 熟悉 SQL、Python/Scala/Java,掌握 ETL/ELT 策略和数据建模方法(星型/雪花模型),能构建从 ODS 到 ADS 的全链路数仓。
  • 理解数据治理、元数据管理和数据安全,熟悉 Apache Atlas、AWS Glue Data Catalog 等数据目录工具;能够设计数据血缘和数据资产目录,确保合规与安全 。
  • 具有团队管理和项目管理经验,能够带领 3–5 人的团队,协调多个项目并推动上线。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请