2-3万
金斯瑞生物科技公司
工作职责/Responsibilities
设计企业级数据架构:统筹规划湖仓一体、批流融合的统一数据底座,支撑实时分析、BI报表及AI智能应用场景的高效数据供给。
主导主数据治理工作:对客户、物料、员工等核心主数据治理,制定唯一标识规则、全生命周期管理机制。
构建标准化数据模型:设计分层合理(ODS/DWD/DWS/ADS)、主题清晰的公共数据模型,确保指标、维度口径统一,提升数据复用能力。
支持AI/ML数据链路:构建从原始日志到特征工程、样本构造、训练数据版本管理的端到端管道,保障机器学习模型输入的高质量与一致性。
推动数据治理落地:建立覆盖元数据管理、数据血缘追踪、质量监控、安全分级与合规审计的治理体系,提升数据可信度与可用性。
选型与演进技术栈:评估并引入先进数据技术(如Feature Store、向量数据库等),持续优化平台性能、成本与可维护性。
协同跨职能团队推进:紧密联动业务、产品、数据工程、算法及运维团队,推动架构方案共识、资源协调与高质量交付落地。
四、任职要求/ Qualifications
学历
Educational Background 本科及以上学历 专业要求
Major 计算机/统计学/数学/信息管理等相关专业
专业知识和技能
Knowledge & Skills 数据架构:熟悉数据仓库、数据湖、湖仓一体架构,掌握维度建模与分层设计。有Dataworks开发经验优先。
主数据治理:有客户、物料、员工等核心主数据平台搭建经验,能设计统一ID与主数据管理方案。
大数据技术:熟练使用 Spark、Flink、Kafka、Hive 等主流引擎,了解数据湖。
AI/ML支持:理解特征工程与训练数据 pipeline,有 Feature Store 或向量数据库经验者优先。
数据治理:掌握元数据、数据血缘、质量监控,有安全合规实践经验优先。
编程能力:精通 SQL,熟练使用 Python 进行数据处理,具备 Shell/Scala/Java 开发能力。擅长试用Cursor等AI编程工具优先。
业务与协作:能快速理解业务需求,具备良好沟通能力,推动跨团队技术方案落地。
工作经验
Work Experience 7年以上数据领域经验,其中至少2年从事数据架构或主数据治理相关工作;
能力素质
Competencies 系统性思维:能从全局视角设计数据架构,兼顾当前需求与长期演进。
业务理解力:快速洞察业务本质,将复杂问题抽象为可落地的数据方案。
沟通协调力:清晰表达技术方案,有效协同产品、工程、算法及业务团队。
推动力与ownership:主动承担责任,推动标准落地,解决跨团队协作中的阻塞问题。
学习与前瞻性:持续跟踪数据领域新技术,并评估其适用性。
结果导向:关注数据架构的实际业务价值,而非仅追求技术先进性。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕