职位详情
行业数据采集实习生
120-150元/天
淘数科技(北京)有限公司
北京
本科
01-06
工作地址

石头科技大厦

职位描述
岗位职责
1、负责制定行业数据采集策略与方案,针对目标行业的政策法规、市场动态、竞争对手、产业链上下游等关键信息,规划数据采集范围、来源与频率。
2、搭建并优化数据采集体系,运用爬虫技术高效采集公开数据,确保采集渠道的稳定性与合法性。
3、负责数据的清洗、校验、整合与标准化处理,识别并处理数据缺失、重复、异常等问题,提升数据质量,构建结构化数据资产,保障数据的准确性、完整性与时效性。
4、负责数据采集工具与分析模型的日常维护与迭代优化,跟踪行业数据采集技术的前沿动态,引入新工具、新方法提升数据采集与分析效率。
5、配合业务部门完成专项数据需求调研与分析工作,协助解决业务开展过程中的数据相关问题,推动数据价值在各业务环节的落地应用。
5、建立数据安全与合规管理机制,确保数据采集、存储、使用全流程符合国家相关法律法规及公司数据安全规范。
任职要求
1、 本科及以上学历,统计学、数学、计算机科学、信息管理、经济学等相关专业优先;
2、 有行业数据采集、数据分析相关工作经验,有固定行业数据分析经验者优先;
3、具备良好的职业道德,严格遵守数据合规要求,有强烈的责任心与严谨的工作态度。
4、精通至少一种爬虫技术框架(如Scrapy、PySpider),熟练使用Python/Java等编程语言进行数据采集脚本开发,能够应对反爬机制(如IP代理、验证码识别、动态页面解析等);
5、熟练掌握SQL语言,能够熟练使用MySQL、Oracle等至少一种数据库进行数据查询、提取与加工;
6、掌握数据清洗、转换、整合的常用方法,熟悉Excel高级功能(如数据透视表、函数公式),能够使用Pandas、Numpy等工具进行数据处理;
7、具备基础的数据分析与可视化能力,能够使用Matplotlib、Seaborn、Tableau、Power BI等工具制作数据图表,清晰呈现分析结果;
8、了解行业数据来源渠道,具备独立规划并执行数据采集项目的能力,能够快速响应业务数据需求;
9、具备良好的逻辑思维能力、数据分析能力与问题解决能力,能够从海量数据中挖掘核心信息与商业洞察。
10、 具备优秀的文字撰写能力,能够独立完成高质量的数据分析报告;
11、具备良好的沟通协调能力与团队协作精神,能够高效配合业务部门开展工作;
12、具备较强的学习能力与抗压能力,能够快速适应行业变化与工作挑战;
13、有良好的细节把控能力,对数据的准确性、完整性有较高的敏感度。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请