职位详情
数据负责人
2.4-4.5万
南京芷铭企业管理咨询有限公司
上海
1-3年
本科
11-11
工作地址

风和投资管理咨询(上海)有限公司

职位描述
职位概要
我们正在寻找⼀位兼具技术深度与管理能⼒的“数据负责⼈”,能够统筹公司整体数据体系
建设,负责数据采集、集成、清洗、存储、特征加⼯及数据质量管理等全流程⼯作。
该职位要求候选⼈既能亲⾃下场解决复杂数据问题,也能带领⼩团队打造稳定、⾼质量
的数据基础设施,为公司后续的算法、分析与产品提供坚实⽀撑。
主要职责
1. 数据架构规划与实施
负责数据平台架构设计,建⽴从原始数据到特征数据的全流程标准;
优化数据流转、同步与更新机制,确保系统的稳定性、可扩展性与成本效率。
2. 数据采集与整合
设计与维护多源数据接⼊(API、爬取、⽂件批量导⼊等);
负责供应商或外部数据源的技术对接、格式转换与数据验证。
3. 数据清洗与质量管理
建⽴⾃动化的数据清洗、校验和异常监控机制;
招聘需求
1设计数据标准化流程(⽇期、时区、单位、ID匹配等),保证数据⼀致性与可追
溯性。
4. 特征⼯程与数据加⼯
建⽴特征⽣成与管理体系(版本控制、时间窗⼝、延迟期、可复现性);
与建模团队协作,优化特征设计及数据交付效率。
5. 数据平台与基础设施
规划并管理数据存储、备份、权限、安全与合规;
参与数据集群、管道调度、数据湖或数仓的设计与维护。
6. 团队建设与管理
招聘、培养并带领数据⼯程师团队;
制定研发规范与流程,推动代码质量与团队协作效率提升。
任职要求
技术能⼒
精通 Python 与 SQL,熟悉主流数据库与分布式计算框架(如 Spark、
ClickHouse、Presto、Flink 等);
熟悉 数据编排⼯具(Airflow、Prefect、Argo等)与任务调度机制;
了解 云端与容器化环境(AWS、GCP、K8s、Docker);
具备数据质量管理与⾃动化测试经验(如 Great Expectations、Soda、⾃研框架
等);
理解时间序列数据与特征滞后处理,熟悉版本化数据管理与数据契约概念;
具备基础的Linux、Git、CI/CD 流程知识。
经验背景
5年以上数据⼯程或数据平台搭建经验;
⾄少2年技术团队管理或项⽬负责⼈经验;
有复杂系统中构建⾼可⽤数据架构的成功案例;
招聘需求
2熟悉多源异构数据治理与数据合规(隐私、版权、使⽤协议等)。
个⼈特质
强执⾏⼒与问题导向,能独⽴解决模糊环境下的复杂问题;
既有战略思维,⼜愿意亲⾃编程和调试;
注重质量、稳定性与⼯程可复现性;
善于跨部门沟通,能与算法、运维、业务等多⽅⾼效协作。
加分项(可选但强烈欢迎)
有AI / NLP / ⼤模型 / 推荐系统 / ⻛控 / 科研数据等项⽬经验;
熟悉 特征商店(Feature Store)、数据湖(Data Lake)、数据契约(Data
Contract) 实践;
对数据可观测性(data observability)、特征漂移(drift)、数据版本化等有实战经
验;
有创业⼼态,愿意在⾼标准与⾼⾃由度的环境中搭建从0到1的体系。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请