岗位职责:
1. 根据业务需求,研究爬虫策略和防屏蔽规则,设计和开发分布式爬虫,支持高并发多平台抓取;
2. 负责网页信息抽取、简单清洗、数据入库等开发;
3. 提升爬虫稳定性及可扩展性,充分利用资源,优化爬虫效率和质量。
任职资格:
1. 计算机软件及相关专业本科毕业;
2. 1-3年爬虫项目开发经验,优秀应届生亦可;
3. 熟悉爬虫原理及常见的反爬虫技术,如cookie、js加密、base64等;
3. 熟练运用python及多进程、多线程开发;
4. 熟练使用scrapy、requests、selenium、pyppeteer等爬虫包;
5. 熟悉html,正则、xpath等提取技术;
6. 熟悉Mysql、Redis等数据库及相关操作;
7. 熟悉Linux基础命令;
8. 有Django/Flask等web框架开发经验者优先。
职位福利:五险一金、年底双薪、绩效奖金、餐补、通讯补助、带薪年假、补充医疗保险、定期体检