职位详情
采集运维人员
7000-10000元
天津德科兴业科技有限公司
天津
1-3年
大专
09-19
工作地址

十一经路

职位描述
  • 必备经验: 拥有2年以上网络爬虫或数据采集相关开发经验。

  • 编程基础: 精通 Python,熟悉其多线程、异步IO、网络编程等特性。具备良好的编程习惯和扎实的计算机基础。

  • 爬虫框架: 精通 Scrapy, Requests, BeautifulSoup, Selenium, Playwright 等至少一种主流爬虫框架和工具。

  • 数据处理: 熟悉网页解析技术(XPath, CSS Selector, 正则表达式),能熟练处理JSON、HTML、XML等格式数据。

  • 反爬应对: 具备丰富的反爬虫应对经验,熟悉代理IP、User-Agent轮换、请求头定制、Cookie管理等技术。

  • 数据存储: 熟悉至少一种数据库,如 MySQL, MongoDB, Redis,了解其性能优化。

  • 系统运维: 了解 Linux 常用命令,能进行基本的服务部署、日志分析和故障排查。

加分项(优先考虑):
  • 有大规模、分布式爬虫系统(基于 Scrapy-Redis, Celery 或自研框架)的开发和调优经验。

  • 熟悉Docker容器化技术,有爬虫项目容器化部署经验。

  • 有验证码识别(图像、滑块、点选等)技术实践经验。

  • 了解消息队列(如 Kafka, RabbitMQ)的基本原理和使用。

  • 有App端数据采集经验,熟悉 Charles/Fiddler 抓包、mitmproxy 或 Xposed/frida 等逆向工具。

  • 了解基本的前端知识(HTML, CSS, JavaScript),能分析前端加密逻辑。

软技能与素质:
  • 具备优秀的问题分析能力和解决复杂问题的热情,喜欢挑战技术难题。

  • 具有很强的责任心、主动性和团队协作精神。

  • 具备良好的学习能力,能快速跟进新的技术和反爬手段。

  • 对数据敏感,有强烈的质量意识和严谨的工作态度。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请