职位描述
岗位职责
1、负责数据采集爬取、解析和提取,对数据进行过滤、去重、清洗、结构化处理、数据入库等工作;
2、负责爬虫平台的设计和开发,包括调度策略、分布式的设计与优化;
3、负责分析结构化和非结构化数据,并对数据抓取、信息提取、去重和清洗。
任职要求
1、本科及以上学历,计算机软件或相关专业,3 年以上 python 开发经验;
2、精通 Python,熟悉 Scrapy 爬虫框架,有丰富的反爬经验;
3、熟悉使用 MySQL/MongoDB/Redis/Hbase 其中至少一种;
4、熟练掌握正则表达式,XPath 等信息抽取技术;
5、有企业信息数据采集经验者优先。
福利待遇
1、五险一金(试用期即投)、工龄工资、绩效工资、全勤奖、节日福利;
2、国家法定节假日,另有婚假、产假、哺乳假等众多福利;
3、作息时间:8:30-17:30,午休:12:00-13:30,周末双休;
4、高档舒适的办公环境,工作氛围轻松,人性化管理。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕