职位描述
岗位职责
●负责维护爬虫系统,实现对目标网站的全站爬取,抽取网页中的特定内容
●负责对爬取的数据进行清洗,存储,分析和展示
●负责对爬虫系统的性能,稳定性,可扩展性进行优化和改进
●负责对爬虫系统的运行状态进行监控,及时发现和解决问题
任职要求
●本科及以上学历,计算机相关专业
●熟练掌握Python语言,熟悉常用的爬虫框架和库,如Scrapy,Requests,BeautifulSoup等
●熟悉HTTP协议,了解常见的反爬策略和应对方法
●熟悉MySQL或MongoDB等数据库的使用,能够进行数据的增删改查和备份
●熟悉Linux操作系统,能够使用Shell脚本进行任务调度和自动化,能够使用Git进行版本控制和协作开发
●具有良好的编码风格和文档习惯,能够编写可读性强,易于维护的代码
●具有良好的逻辑思维能力,能够分析和解决复杂的技术问题
●具有良好的沟通能力和团队协作精神,能够主动学习新技术和分享经验
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕