职位描述
需要线下一轮面试,暂不安排线上面试。
1.负责数据中台核心模块开发,包括数据采集、清洗、存储、计算及服务化输出;
2.设计企业级数据仓库架构,构建分层模型(ODS/DWD/DWS/ADS)并确保高效可扩展;
3.搭建数据治理体系,制定元数据管理、数据血缘、质量监控(如完整性/一致性校验)方案;
4.开发数据质量管控工具(如异常检测、自动修复),推动数据标准与合规性地落;
5.优化海量数据(TB/PB级)处理性能,支持实时(Flink/Kafka)与离线(Hive/Spark)场景需求;
要求:
编程语言:精通Java、SQL 、熟悉Pyhton
技术栈:
熟悉hadoop、spark、flink大数据生态,有实际java FlinkStreaming、FlinkCDC开发经验
Kafka、Doris、Mysql 等大数据相关组件使用经验
充分了解数仓分层建模理论,包括从数仓建模到指标开发,有数据治理的相关经验
2年以上工作经验,有0到1经验优先
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕