职位描述
1、负责公司内容数据采集、清洗、解析、入库;
2、负责多平台信息爬取和页面内容的提取分析以及负责破解各类反爬机制;
3、研究爬虫策略和防屏蔽规则,解决封账号、封IP、验证码、页面跳转等难点攻克,提升网页抓取的效率和质量。
任职要求:
1、三年以上抓取爬虫研发经验;
2、熟练使用 Python 进行软件开发;
3、熟练运用 OOP 编程思想进行软件开发;
4、熟悉常见的网络 I/O 模型,善于优化爬虫性能、提升爬虫稳定性;
5、熟悉 Xposed / Frida / Charles / IDA 等分析工具具备一定的App逆向分析能力;
6、熟悉 HTTP 协议、 TCP/IP 协议、ProtoBuf 协议等常见传输协议。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕