职位详情
数据工程师
1.3-1.6万
北京哲源科技有限责任公司
北京
1-3年
本科
01-09
工作地址

北京卫星制造厂科技园-6号厂房2门5层

职位描述
核心职能

· 数据获取与整合:负责临床数据(如电子病历、临床试验数据)与多组学数据(如基因组、转录组、蛋白组等)的获取、清洗、对齐与标准化。

· 数据工程与平台管理:设计、构建并维护公司级数据管道与平台,确保数据资产的安全、高效访问与全生命周期治理。


主要职责

· 建立从内外部数据源(如实验室、合作方、公共数据库)到分析-ready数据集的自动化数据管道(ETL/ELT)。

· 设计与实施适用于临床与多组学数据的数据模型、整合方案与治理规范(如OMOP、CDISC等标准)。

· 构建与优化数据平台与服务体系,提升海量多组学数据的存储、查询与计算效率,直接支持科研分析与AI模型训练。

· 确保数据处理流程符合数据安全、隐私保护(如HIPAA/GDPR)及行业合规要求。


任职要求

· 计算机、生物信息学、统计学或相关专业背景。
· 精通 Python 和 SQL,具备使用 Spark、Airflow

等数据工具的经验。

· 可经常前往深圳、上海出差

· 在以下至少一个职能领域有实践经验:

· 数据获取/整合职能:有处理临床数据或多组学数据(如NGS数据)的实际项目经验,熟悉其数据结构和常见挑战。

· 数据平台/管理职能:有在云平台(AWS/Azure/GCP)上设计、构建或维护数据平台的经验。

· 出色的团队协作与沟通能力,对生物医学领域有强烈兴趣。

优先考虑

· 熟悉医疗数据标准(如OMOP
CDM、CDISC)或组学数据格式(如FASTQ、VCF、GCT)。

· 有生物信息学分析流程(如RNA-seq)或常用数据库(如TCGA、GEO)的使用经验。

· 了解云原生数据架构及数据治理框架。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请