职位详情
爬虫工程师
3000-5000元
北京云采科技有限公司
北京
1-3年
本科
09-15
工作地址

北京市丰台区新村街道诺德中心11号楼35层3501

职位描述
线上办公
岗位职责​
1.数据抓取平台搭建与优化:负责公司数据抓取平台的构建工作,从平台的架构设计到具体功能实现都需全程参与。持续对平台进行优化,通过技术手段提升平台性能,确保数据收集过程的准确性和高效性。​
2.爬虫策略设计与实施:针对不同网页存在的复杂结构以及各种反爬机制,进行深入分析和研究。在此基础上,设计出高效、可行的爬虫策略,并将其转化为实际的技术实现,保证能够顺利抓取目标数据。​
3.数据处理流程开发与维护:开发数据清洗、处理和整合的相关流程,制定科学合理的数据处理标准和规范。定期对这些流程进行维护和升级,及时解决流程中出现的问题,不断提升数据处理质量。
岗位要求​
1.编程基础:精通 Python 编程语言,具备扎实的编程基础,能够熟练运用Python 进行代码编写。拥有良好的代码习惯,编写的代码具有可读性、可维护性和可扩展性。​
2.数据库技术:熟悉常见的数据库技术,包括 MySQL、Clickhouse、Oracle 等。能够根据业务需求设计合理的数据库结构,同时拥有数据库优化经验,可对数据库性能进行调优,提升数据存储和查询效率。​
3.爬虫技术能力:具备解决爬虫技术难点的能力,其中包括但不限于 js 逆向、js 加密等方面。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请