岗位职责:
1、能理清复杂医疗业务,设计可扩展的数据模型;与客户、产品团队沟通顺畅,准确落实需求。
2、适应医疗数据敏感和紧急更新需求,能快速学会云原生、实时计算等新技术。
3、负责对接业务部门,分析数据需求,设计符合医疗业务的各类数据模型和数据仓库结构。
4、负责医疗数据的抽取、清洗、转换与加载(ETL),确保 HIS、EMR、PACS 等多源异构数据的整合质量。
5、搭建数据库模型,优化查询效率,解决海量医疗数据存储和计算问题。
6、建立数据质量检测机制,制定清洗规则,维护数据字典,保证数据可追溯和一致。
7、和开发团队合作将数据模型嵌入业务系统,编写自动化脚本;提供技术文档与团队培训,研究新技术提升医疗数据处理效率。
任职资格:
1、本科及以上学历,计算机、统计等相关专业,医疗 AI 方向优先硕士;具备3年以上医疗数据开发或建模经验,主导过相关项目。
2、精通数据治理框架(DAMA / DCMM),掌握维度建模、实体关系建模等设计方法,具备数据管道架构能力。
3、精通SQL、Python / R;掌握PyTorch / TensorFlow等框架。
4、掌握Hadoop/Spark生态(Hive、Flink),掌握MySQL/Oracle等数据库调优。
5、熟练使用ETL工具(DataX、DolphinScheduler)及数据建模工具(PowerDesigner / ERWin)。
6、了解机器学习算法(XGBoost、聚类分析)及特征工程方法。
7、熟悉医院核心系统(HIS、EMR、LIS)及业务流程,了解医疗数据标准(ICD-10、医学术语)。
8、掌握Kimball / Inmon数据仓库理论,熟悉维度建模、数据湖/中台架构。