职位描述
岗位职责:
1、研究各种网页的数据特点和规律,研发和优化数据抽取、清洗算法;
2、根据项目要求进行维度分析,设计数据采集结构,编写数据采集脚本;
3、选型、优化数据采集工具,编制数据采集、加工、清洗、入库等完整方案,并执行;
4、根据工作安排,负责相关数据的自动化采集、抽取及清洗工作并按时完成交付结果;
5、维护数据增量更新变动及修改,保证数据新鲜度及数据质量;
6、配合研发部门数据应用需求。
任职资格:
1、本科及以上学历,计算机科学、数据科学、信息技术或相关领域专业毕业;
2、具有3年以上数据采集和清洗相关工作经验,有大数据处理经验者优先;
3、熟悉各种爬虫框架、数据采集工具,熟练使用多线程进行数据采集;
4、了解数据结构和算法设计,能够从结构化和非机构化的数据中抽取信息;
5、精通Shell脚本、Python或Java等编程;
6、熟悉数据存储技术,如MySQL、Redis、MongoDB、OceanBase等;
7、责任心强,具有良好的团队协作精神和沟通能力。
薪资福利:
1、月薪:高底薪 + 绩效 + 补助;
2、福利:周末双休、五险一金、话费补助、误餐补助、交通补助、年终奖金、带薪年休假、健康体检、节日福利、培训学习、员工活动;
其他事项:入职集团子公司(安徽标信查数据技术有限公司,www.biaoxincha.com),从事软件开发与大数据业务!
工作地址:合肥市高新区创新大道2800号创新产业园二期F3栋15楼整层;
****温馨提示:请应聘者认真了解任职资格要求,具备条件后方才投递简历,谢谢!!!****
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕