职位详情
数据采集工程师
1-1.5万
上海现代通用识别技术有限公司
上海
不限
本科
04-29
工作地址

上海通用识别技术研究所(西门)恒南路1000号(国家电网对面)2号楼

职位描述

岗位职责:

1、负责设计和开发高效、稳定的网络爬虫系统,从各种数据源中抓取数据;

2、对抓取到的数据进行清洗、去重、转换等处理,确保数据的质量和准确性;

3、解决爬虫过程中遇到的各种技术问题,如反爬机制、IP封锁、验证码识别等;

4、持续优化爬虫策略和算法,提高数据抓取的效率和覆盖率;

5、与数据分析师、开发团队等合作,将抓取到的数据集成到公司的数据平台或应用中。


任职要求:

1、计算机、软件工程等统招本科及以上学历,应届生或有相关开发经验;

2、熟练掌握至少一门编程语言 Python、Java 等,熟悉常用的爬虫框架和工具,如 Requests、BeautifulSoup、Selenium(Python)/Jsoup、OkHttp、Selenium(Java) 等;

3、熟悉 HTTP 协议、HTML、CSS、JavaScript 等,能够分析网页结构和数据提取逻辑;

4、熟悉数据库操作,如 MySQL、MongoDB等;

5、了解分布式爬虫架构和技术,能够应对各种复杂的反爬机制;有大规模数据抓取经验者优先;

6、对数据敏感,有数据分析和挖掘经验者优先;

7、具有良好的专业素养,有较好的学习能力,有分析问题、解决问题的能力,有较好的领悟力和执行力;
8、工作积极互动,责任心强,服从安排,身心健康,有一定的抗压能力;
9、善于沟通,具备较好的团队合作精神。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请