职位详情
python爬虫实习生
100-200元/天
北京麦麦趣耕科技有限公司
北京
本科
09-13
工作地址

信创园A区-6号楼4层

职位描述
岗位职责:
  1. 数据爬取: 编写高效的Python爬虫脚本,从指定的公开网站、API接口、气象数据平台、农业政务网站等渠道,自动化抓取多源异构数据(如气象数据、土壤墒情、遥感影像、作物价格、病虫害情报、学术论文等);

  2. 数据清洗与处理: 对爬取到的原始数据进行清洗、去重、格式化、转换和集成,确保数据的准确性和一致性,使其满足作物模型研究的输入要求;

  3. 反爬策略应对: 研究并实施合理的策略以应对常见的反爬虫机制(如IP限制、验证码、动态加载等),确保数据采集任务的稳定运行;

  4. 文档与协作: 撰写清晰的技术文档,记录爬虫设计思路、数据源结构和数据处理流程,并与研究员保持密切沟通,理解数据需求;

  5. 完成领导交办的其他工作。

任职资格:
1. 2026/2027届在校本科生或研究生,计算机科学、软件工程、数据科学、农业信息技术或相关专业;
2. 熟练掌握 Python 编程语言,有良好的编码习惯;
3. 熟悉常用的网络爬虫框架,如 Scrapy、Requests、BeautifulSoup、lxml 等;
4. 了解网页前端基础(HTML, CSS, JavaScript),能分析网页结构并提取数据;
5. 有处理 Ajax动态加载、Selenium 或 Playwright 模拟浏览器操作的经验;
6. 接触过数据库操作(SQL或NoSQL),了解正则表达式、Pandas 等数据处理库,对多线程/异步IO爬虫有一定了解,有实际爬虫项目经验(课程设计、个人项目均可),对农业、气象、地理或环境科学有浓厚兴趣;
7. 具备出色的学习能力和解决问题的能力,面对技术挑战乐于钻研,做事细心严谨,对数据质量有要求,良好的沟通能力和团队协作精神;
8. 服从管理。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请