职位描述
岗位职责:
1. 参与企业级数据仓库的架构设计、模型设计(维度建模、星型/雪花模型等)和ETL流程开发。
2. 负责数据分层(ODS、DWD、DWS、ADS等)的规划与实现,确保数据规范性和可复用性。
3. 使用工具(如Informatica、DataX、Kettle等)或编程(SQL、Python、Spark等)实现高效数据抽取、清洗、转换和加载。
4. 制定数据标准,监控数据质量,确保数据的准确性、一致性和完整性,参与元数据管理、数据血缘追踪等数据治理工作。
5. 与商业分析师、业务部门协作,提供高效的数据集市或数据API服务,支持BI工具(如Tableau、Power BI)的数据模型搭建。
6. 优化数据处理性能,解决海量数据场景下的效率问题。
任职要求:
1. 本科及以上学历,计算机、数学、统计等相关专业。
2. 熟练掌握SQL,精通至少一种数据库(如MySQL、Oracle、Greenplum等),了解分布式数据库(如Hive、HBase、ClickHouse等)。
3. 熟悉数据仓库理论(如Kimball/Inmon方法论)、建模工具(如Erwin、PowerDesigner)。
4. 具备ETL开发经验,熟悉工具(如Airflow、NiFi、Talend)或自研脚本(Python/Shell)。
5. 熟悉大数据生态(Hadoop、Spark、Flink、Kafka等),有实际调优、互联网医药、大健康等行业数仓项目经验优先。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕