岗位职责:
1. 独立负责从指定网站、微信公众号、小红书等平台进行数据的高效、稳定爬取。
2. 对获取的原始数据进行深度清洗、去重、结构化处理,确保数据质量与可用性。
3. 根据产品需求,设计并实现数据解析与转换逻辑,将处理后的数据以标准化的展示格式对接至产品系统。
4. 维护和优化现有爬虫系统,应对反爬策略,保障数据通道的长期稳定与高效。
5. 编写清晰的技术文档,并与产品、研发团队紧密协作,理解需求并交付可靠的数据解决方案。
任职要求:
1. 本科及以上学历,计算机相关专业,拥有2-3年以上专职爬虫开发经验。
2. 技术非常熟练,精通Python及相关生态(如Scrapy、Requests、Selenium、Playwright等),熟悉常见的数据解析技术。
3. 有丰富的反爬应对经验,能熟练处理各类验证码、动态加载、请求加密等技术挑战。
4. 具备扎实的数据处理能力,熟悉Pandas等工具,能独立完成从爬取到清洗的全流程工作。
5. 有微信公众号、小红书等平台爬取经验者优先考虑。
6. 责任心强,具备优秀的问题解决能力和结果导向思维,能保证任务的按时高质量交付。
我们提供:
1. 具有竞争力的薪酬待遇:待遇优厚,为您的才华提供相匹配的回报。
2. 完善的福利保障:五险一金、带薪年假、年度体检、节日福利等。
3. 健康的工作节奏:标准工作时间,早九晚六,双休,我们关注成果而非形式。
4. 精英化的工作环境:与行业内顶尖、专业的伙伴共事,扁平化管理,沟通高效。
5. 持续的成长机会:参与创新项目,接触前沿技术,获得快速的个人能力提升。