职位详情
python爬虫工程师
8000-12000元
丰翼实业集团有限公司
石家庄
1-3年
大专
04-22
工作地址

丰翼集团帝王国际万悦大厦N1写字楼10楼

职位描述
岗位要求:
1、负责设计和开发分布式爬虫和调度系统,爬虫核心算法和调度策略优化;
2、负责部分网站验证码破解和现有爬虫系统效率的提升;
3、负责网络数据抓取规划和数据链路规划、高效且稳定爬取指定网站的数据;
4、构建高可用性、高可扩展性的网络信息搜集平台;
5、优化现有数据清洗,数据提取,结构化,入库等过程;
6、深度思考并参与业务等数据瓶颈,并有效解决;
7、爬取过建工类相关网站
任职要求
1、python语言,两年或以上爬虫经验;
2、有独立负责过爬虫平台搭建、爬虫系统处理经验,爬虫项目规划能力;
3、熟悉Scrapy、Pyspider、nutch、webmagic等主流爬虫框架使用,了解js引擎技术等优先考虑;
4、熟悉js逆向,混淆原理,js语法树,客户端常用签名算法优先。
5、具备web挖掘等搜索引擎相关知识,有丰富的网络爬虫、网页去重、网页信息抽取的经验,
6、掌握网页抓取原理及技术,包括基于Cookie的登录管理,基于headless的采集,熟悉正则表达式、XPath、Jsoup等网页信息抽取技术。
7、具备较强的团队协作精神,工作责任心强,良好的沟通、理解和执行能力。
【工作时间】
1、8:30-18:00 中午休息1.5个小时;
双休,法定节假日正常休息;

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请