职位描述
 职位描述:
负责多源异构数据的接入、整合与清洗工作。
设计并执行数据清洗、标准化和术语映射规则,构建高质量数据湖。
开发和管理ETL数据流水线,保障数据处理过程的稳定性和效率。
设计与实施数据脱敏方案,确保数据安全与隐私合规。
参与数据质量评估体系的建设,监控数据质量指标,并推动数据质量的持续提升。
职位要求:
计算机、软件工程、信息管理等相关专业,本科及以上学历。
熟练掌握SQL,精通Python/Java/Scala中至少一种编程语言。
熟悉数据仓库理论,有Hive、Spark、Flink等大数据组件使用经验者优先。
了解医疗数据标准(如HL7、FHIR)者优先。
具备优秀的数据分析能力和问题解决能力,注重细节,有强烈的责任心。
  以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕