岗位职责:
1.参与公司医疗大数据平台的湖仓一体架构设计、落地与迭代,结合 HIS、LIS、EMR 等医疗核心业务场景优化数据存储、计算架构,保障医疗数据处理的高效性和稳定性;
2.负责大数据湖仓一体相关组件的部署、配置、调优与日常维护,解决组件运行过程中的故障和性能问题,保障平台 7×24 小时稳定运行;
3.基于医疗业务需求进行数据仓库建模,完成医疗业务数据的 ETL 开发、数据同步与加工处理,支撑公司 HIS 产品的大数据分析、数据挖掘等上层应用;
4.参与医疗大数据治理工作,包括数据标准制定、数据质量监控、数据脱敏等,确保医疗数据处理符合《数据安全法》《个人信息保护法》及医疗行业数据合规要求;
5.与公司产品、研发、业务团队协作,理解医疗行业客户(医院、医疗机构)的大数据需求,转化为技术实现方案并落地;
6.跟进大数据湖仓一体技术前沿,结合医疗 HIS 行业特点进行技术调研和技术沉淀,推动公司大数据平台的技术升级。
任职要求:
1.本科及以上学历,计算机、软件工程、大数据、信息工程等相关专业,3 年及以上大数据相关工作经验,有医疗行业大数据项目经验者优先;
2.精通湖仓一体大数据技术栈与核心组件,熟练掌握 Hadoop、Spark、Flink、Hive、HBase 等基础大数据组件,熟悉 ClickHouse、Apache Doris、StarRocks 等 OLAP 引擎,了解 Iceberg/Hudi/LakeHouse 等湖仓一体核心框架的使用与原理;
3.熟练掌握数据同步工具(Flink CDC、Sqoop 等),具备丰富的 ETL 开发、数据仓库建模经验,能独立完成复杂业务场景下的数据加工与建模工作;
4.具备大数据平台性能调优、故障排查能力,熟悉大数据集群的部署、监控与运维,能解决集群运行、数据处理过程中的各类技术问题;
5.熟悉 SQL,掌握至少一门编程语言(Java/Python),具备良好的代码编写与规范意识;
6.了解医疗行业业务知识,熟悉 HIS、LIS、EMR 等医疗系统数据结构与业务逻辑者优先,具备医疗数据合规、等保测评相关经验者加分;
7.具备良好的需求理解能力、沟通协作能力和问题解决能力,能独立承担大数据模块的开发与运维工作,有团队合作精神和技术钻研态度;
8.具备良好的文档编写能力,能规范输出架构设计、技术方案、运维手册等技术文档。