职位描述
职位描述:
(1) 负责医疗数据场景湖仓一体数据框架的搭建与维护工作。
(2)负责公司数据治理平台数据框架的研发工作。
(3)参与全生命周期的数据治理工作。
(4)参与元数据管理、数据血缘、数据质量、数据标准等数据治理方案的落地工作。
任职要求
(1)本科及以上学历,计算机、数学、通信等相关专业。
(2)熟悉Java、Python语言,在大数据计算和存储相关领域有3年以上的研发经验,并有大规模落地应
用者优先。
(3)精通基于Apache Spark的海量数据的处理、分析、统计、挖掘工作。
(4)精通Apache Spark等开源项目的优化,有patch源码经验者优先。
(5)熟悉湖仓一体框架,具备Iceberg、Paimon、Hudi等主流数据湖框架的搭建、维护和使用经验。
(6)了解基于Apache Doris数据库的数仓建模原理,具备数据模型的设计与脚本开发能力。
(7)熟悉医疗行业数据的采集、清洗、建模与标准化等数据治理流程。
(8)责任心强,具备良好的问题分析及解决能力,团队合作能力
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕