职位详情
数据工程师(医疗AI后勤方向)
8000-15000元·15薪
南京博纳睿通软件科技有限公司
南京
3-5年
本科
10-22
工作地址

南京市雨花台区软件大道180号大数据产业基地5栋206

职位描述
【岗位定位】
医疗后勤大模型项目的“数据基石”构建者。负责从复杂的医院后勤系统中提取、清洗、整合数据,并构建高效的数据管道与向量知识库,为上层的人工智能应用提供稳定、高质量的数据燃料
【核心职责】
1、数据管道设计与开发:设计并实现从各类后勤业务系统(如能源管理、设备监控、工单系统等)到数据平台/数据湖的高效、可靠的数据抽取、转换和加载流程。
2、数据治理与质量保障:负责医疗后勤数据的清洗、去噪、标准化和打标工作,确保数据质量满足大模型训练与应用的要求。
向量知识库构建:负责将后勤领域的结构化与非结构化数据(如设备手册、规章制度、历史报告)进行向量化处理,构建和管理向量数据库,支持大模型的检索增强生成应用。
3、数据安全与合规:严格执行数据安全策略,对敏感数据进行脱敏和匿名化处理,确保所有数据处理流程符合医疗行业的数据安全与隐私保护法规。
跨部门协作:与后勤业务部门、算法团队紧密协作,理解业务需求,定义数据标准,并提供数据支持。
【必备技能与要求】
经验:3年以上数据工程师相关工作经验,有大数据平台、数据仓库或数据湖项目实战经验。
技术栈:
1、精通 SQL 和至少一种编程语言(Python 为首选)。
2、熟练使用至少一种大数据处理框架,如 Spark、Flink 或 Hadoop 生态组件。
3、有丰富的数据ETL/ELT工具使用经验。
4、熟悉至少一种主流云平台(如阿里云、华为云)的数据服务。
5、数据库知识:精通一种或多种关系型数据库和NoSQL数据库。
6、向量数据库:了解并有过至少一种向量数据库的实际使用经验。
加分项:
1、有医疗行业数据处理经验,了解HL7、FHIR等标准者优先。
2、有参与过AI/机器学习项目数据准备工作的经验。
3、具备良好的沟通能力和团队协作精神,对解决复杂业务问题有浓厚兴趣。
985、211本硕学历,电子计算机和数学相关专业的优先

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请