8000-11000元
璧山企业天地
1. 知识图谱全流程构建与互联网产品适配:深入理解互联网产品业务场景(如电商推荐、社交关系、内容分发),设计贴合产品需求的领域知识图谱 Schema(含用户、商品、内容等实体类型及关联关系定义);主导从多源异构数据(用户行为日志、交易数据、非结构化内容)中进行知识抽取、融合与推理,解决 “数据碎片化”“关联挖掘难” 问题;基于 Neo4j 等图数据库搭建知识存储与查询体系,优化图查询性能,支撑互联网产品的智能推荐、个性化内容分发、用户关系分析等场景落地。
2. 用户人物画像体系搭建与迭代:围绕互联网产品用户生命周期(获客、激活、留存、转化、推荐),设计多维度人物画像标签体系(基础属性、行为偏好、兴趣标签、价值分层等);构建画像数据采集与计算模型,通过 SQL 优化、批流融合技术实现标签实时 / 准实时更新;结合知识图谱关联用户多场景行为数据,提升画像精准度,为产品的精细化运营、个性化功能设计提供数据支撑。
3. 数据处理与 SQL 深度优化(互联网场景适配):负责互联网产品大规模数据集(用户行为日志、交易数据、内容数据等)的清洗、转换与整合,设计高效 ETL/ELT 流程,解决高并发场景下的数据一致性与质量问题;针对互联网产品高频查询场景(如用户画像标签查询、商品关联分析),开展 SQL 语句重构、索引优化、物化视图设计等工作,优化 OLAP 引擎(如 StarRocks)查询性能,降低数据处理延迟,保障推荐系统、运营报表等核心数据服务稳定性。
4. 统计分析与互联网产品业务赋能:运用统计学方法(如回归分析、聚类分析、假设检验、A/B 测试分析)对互联网产品数据进行深度挖掘,构建核心业务指标体系(如 DAU/MAU、转化率、留存率、LTV);从用户行为、产品功能、运营活动数据中提取商业洞察,针对产品迭代(功能优化、新功能上线)、运营策略(活动策划、用户分层运营)输出专题分析报告,明确增长驱动力与风险点,为管理层决策提供数据支撑。
5. 多工具可视化体系搭建(互联网场景聚焦):熟练运用多种可视化工具(FineBI、Power BI、Tableau 等)开发互联网产品专属数据看板(用户画像看板、运营监控看板、推荐效果看板、功能迭代效果看板),实现动态钻取、多维度联动分析;设计标准化可视化规范,确保报表兼具数据准确性与视觉可读性,同时开展工具使用培训,提升产品、运营团队自主分析能力,助力快速决策。
6. 跨团队协同与互联网产品流程优化:对接互联网产品团队、运营团队、研发团队梳理数据需求,提供从数据采集、图谱构建、画像计算到分析可视化的端到端解决方案;跟踪大数据技术趋势(如实时数仓、智能 BI、大模型与知识图谱融合),结合互联网产品快速迭代特性,优化数据处理链路与工具选型,推动数据驱动的产品迭代与运营优化,助力产品增长。
7. AI 技术融合与数据挖掘落地:结合 AI 技术(如大模型、机器学习算法)优化知识图谱构建与用户画像精度,例如利用大模型提升非结构化数据知识抽取效率,通过机器学习算法优化用户标签权重计算;开展数据挖掘项目,从海量互联网数据中挖掘用户潜在需求、行为规律及业务增长机会,输出可落地的挖掘模型与应用方案。
8. 数据标注体系搭建与质量管控:针对 AI 模型训练、知识图谱构建需求,设计数据标注标准与流程(如实体标注、关系标注、情感标注),协调标注团队开展工作;建立标注质量校验机制(如抽样检查、交叉验证),保障标注数据准确性,为 AI 模型优化、知识图谱精准度提升提供高质量数据支撑。
二、任职要求1. 学历背景:本科及以上学历,计算机科学、数据科学、统计学、数学、人工智能等相关专业优先;硕士学历且有互联网产品知识图谱、用户画像或 AI 数据处理相关经验者加分。
2. 工作经验:3 年以上大数据处理相关经验,具备完整的知识图谱构建与用户画像落地案例;有电商、社交、内容资讯、工具类等互联网产品数据处理经验者优先;具备 AI 技术(如大模型应用、机器学习)在数据处理中的实践经验,或有数据挖掘、数据标注项目主导经验者优先;熟悉互联网产品实时数仓搭建、高并发查询优化或用户增长数据分析场景者优先。
3. 专业技能:
(1) 数据技术栈:精通 SQL,熟练使用 Python(Pandas、NumPy、Scikit-learn、PySpark)或 Java,掌握 Hadoop、Spark 等大数据框架,具备批处理与流处理(Kafka、Flink)开发能力,能处理互联网产品高频产生的海量用户行为数据;
(2) 知识图谱能力:熟悉 NLP 基础技术(分词、命名实体识别、关系抽取、实体链接),能基于 spaCy、DeepKE、LTP 等工具进行互联网场景(如商品实体抽取、用户关系挖掘、内容标签抽取)知识抽取调优;精通 Neo4j 等图数据库及 Cypher/Gremlin 查询语言,具备图谱性能优化经验,能支撑互联网产品高并发查询需求;
(3) 用户画像能力:掌握人物画像构建方法论,熟悉标签体系设计(多层级标签、标签权重计算、标签衰减规则),具备基于 Hive、Spark、Flink 实现实时 / 准实时标签计算的经验;能结合互联网产品用户行为数据(浏览、点击、购买、互动等)优化画像模型,提升标签精准度,有画像在推荐系统、个性化运营中落地的实战经验;
(4) 统计与优化能力:扎实掌握统计学原理与互联网产品数据分析方法论(A/B 测试设计与分析、漏斗分析、留存分析、用户分群分析),能独立设计产品迭代、运营活动的分析模型;具备 SQL 优化实战经验,熟悉 StarRocks、ClickHouse 等 OLAP 引擎架构,能解决互联网产品高并发查询(如高峰时段用户画像查询、运营活动数据查询)瓶颈;
(5) 可视化能力:熟练运用至少 2 种主流可视化工具(FineBI/Power BI/Tableau),能独立开发互联网产品复杂业务看板(如用户增长看板、推荐转化漏斗看板、画像标签分布看板),有可视化规范搭建或针对互联网高频数据更新场景的可视化性能优化案例者优先;
(6) AI 与数据挖掘能力:熟悉机器学习算法(如分类、聚类、回归、协同过滤),能使用 Scikit-learn、TensorFlow/PyTorch 等工具构建数据挖掘模型(如用户流失预测、商品推荐模型);了解大模型(如 GPT 系列、开源大模型)应用场景,有利用大模型优化数据处理(如文本数据清洗、知识问答)经验者优先;
(7) 数据标注能力:掌握数据标注方法论,能设计符合 AI 模型训练、知识图谱构建需求的标注标准(如实体标注规范、关系标注流程);具备标注质量管控经验,能通过抽样校验、标注工具优化提升标注效率与准确性,有搭建标注团队或管理标注项目经验者优先。
1. 综合能力:
(1) 具备 “技术 + 互联网产品 + 业务” 三重理解能力,能深入理解互联网产品逻辑(如推荐算法逻辑、用户增长模型、运营活动机制),从产品、运营需求中抽象数据模型与分析框架;
(2) 逻辑思维缜密,问题解决能力突出,能快速定位互联网产品数据质量(如用户行为数据缺失、画像标签不准)、查询性能(如高峰时段报表加载慢)等问题并提出解决方案;
(3) 优秀的跨团队沟通能力,能高效对接互联网产品经理、运营、研发团队,清晰传递数据价值,推动数据项目落地与知识沉淀,助力产品迭代与运营优化;
(4) 对互联网行业趋势(如 AIGC 在产品中的应用、私域流量运营、精细化用户运营)及 AI 技术发展(如大模型轻量化、机器学习工程化)敏感,能结合数据技术为产品创新与业务增长提供新思路。
2. 加分项:
(1) 有 Transformer 系列模型(BERT、RoBERTa)或大模型在互联网场景知识抽取(如商品评论情感分析、用户兴趣标签挖掘)、数据挖掘(如个性化推荐、用户意图识别)中的应用经验,或主导过千万级节点互联网产品知识图谱项目者优先;
(2) 具备互联网产品用户画像平台搭建经验,能设计可配置化标签体系、支持多业务线画像复用,或有数据挖掘模型(如用户生命周期价值预测模型)落地并带来业务增长(如转化率提升、流失率下降)者优先;
(3) 熟悉 CDC/binlog 实时同步技术、Flink SQL 实时计算,有互联网产品实时用户画像、实时推荐效果分析或实时数据挖掘模型落地经验者优先;
(4) 具备 PMP/ACP 等项目管理认证,或拥有大数据技术、AI 相关专利、论文,或有主导大规模数据标注项目(如百万级文本标注、图谱实体标注)经验者优先。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕