岗位要求:
1. 负责设计开发爬虫系统以及优化爬虫策略,进行多平台信息的抓取和分析
2. 设计爬虫策略和防屏蔽规则,完成对复杂网站信息抓取
3. 参与业务功能需求探讨,数据分析处理落地,并提供后端接口
任职资格:
1、熟练使用python,熟练爬虫开发,熟练使用scrapy、selenium开源框架,1年及以上python爬虫经验;
2、熟练常见反爬机制,IP代理池、headers认证和cookie等;
3、对HTTP协议及HTML有深入理解,精通正则,xpath等,熟练从结构化和非结构化的数据中获取信息;
4、积极主动,愿意接受挑战,抗压性强。