职位详情
高级数据工程师
1.5-3万
药石科技
南京
5-10年
本科
01-22
工作地址

南京药石科技股份有限公司

职位描述
一、核心工作职责

1. 搭建AI建模全流程数据链路,完成多源数据采集、清洗、加工,支撑模型离线训练与在线推理供数

2. 负责数据模型建模,设计维度/事实模型、星型/雪花模型及主题宽表,落地AI建模与用户画像底层数据支撑

3. 主导特征工程,设计特征抽取、融合、筛选逻辑,搭建特征存储复用体系,适配各类AI模型需求

4. 构建批量+实时数据Pipeline,优化链路吞吐与延迟,保障数据流转高效稳定

5. 落地图/向量数据库数据链路,加工图特征与向量特征,支撑知识图谱、大模型RAG、图神经网络等AI场景

6. 设计规则+AI辅助数据打标方案,落地大规模数据打标,保障标签精准度与一致性

7. 搭建多维度用户画像体系,整合数据输出完整用户标签,维护标签全生命周期与时效性

8. 迭代优化数据模型、特征及标签体系,适配业务迭代与AI模型升级

9. 搭建全链路数据质量监控告警,落实数据合规与隐私保护要求,规避数据风险

10. 沉淀数据模型、特征、标签等资产规范,推动跨场景复用,提升团队协作效率

二、任职要求

1. 本科及以上,计算机/大数据/统计相关专业,3年+大数据开发经验,2年+AI建模数据支撑经验

2. 精通Spark/Flink/Hadoop大数据生态,熟练用Spark/Flink SQL处理大规模数据开发

3. 精通数据模型建模,擅长维度建模与主题模型设计,能独立落地AI与画像场景底层数据模型

4. 掌握Hive/ClickHouse/Doris等存储组件,可按需完成建模、画像场景存储选型与落地

5. 精通特征工程全流程,熟悉特征筛选、降维、漂移治理,了解Feast等特征存储工具

6. 熟练掌握Python/Java,能用Pandas/NumPy做数据探索,懂TF/PyTorch与数据层对接逻辑

7. 精通Neo4j/NebulaGraph(图数据库)、Milvus/FAISS(向量数据库),能完成数据建模与索引调优

8. 具备独立设计数据打标方案、搭建用户画像标签体系的实战能力

9. 能解决数据分布漂移、数据不平衡问题,优化数据模型计算、图/向量检索效率

10. 掌握数据质量管控方法,熟悉数据隐私保护与合规要求,能落地全流程合规管控

11. 具备大数据生态与图/向量库、AI框架、打标工具的联动开发能力

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请