主要职责:
1、设计和构建高性能的数据仓库架构,包括数据湖、数据仓库和数据集市。
2、引领数据开发团队,指导数据集成、ETL(抽取、转换、加载)流程的设计与实施。
3、选择并优化数据存储和检索技术,确保数据的完整性、一致性和安全性。
4、监控数据仓库的性能,进行调优和扩展,以应对不断增长的数据量和复杂性。
5、与业务分析师和数据科学家合作,理解数据需求并转化为技术解决方案。
6、制定数据治理政策,确保数据质量和合规性,符合HIPAA、GDPR等医疗数据隐私法规。
7、评估和引入新技术和工具,以增强数据仓库的功能和效率。
8、培训和指导团队成员,提升团队的数据开发能力和数据管理意识。
任职要求:
拥有计算机科学、数据科学或相关领域的学士或硕士学位。
至少5年以上数据仓库架构和开发经验,有医疗行业经验者优先。
精通数据仓库建模方法(如星型模式、雪花模式)。
熟练掌握SQL和至少一种ETL工具(如Informatica、Talend、DataStage)。
熟悉大数据处理框架(如Hadoop、Spark)和NoSQL数据库(如MongoDB、Cassandra)。
有云数据仓库经验,熟悉AWS Redshift、Google BigQuery或Azure Synapse等云服务。
强大的问题解决能力和项目管理技巧。
良好的沟通和团队领导能力,能与非技术背景的同事有效沟通
加分项:
拥有数据仓库相关的专业认证(如CDWA、CDEP)。
有BI工具的配置和集成经验。
熟悉数据治理和数据质量工具。
有医疗数据隐私法规(如HIPAA、GDPR)的合规经验。