职位描述
1.负责大模型相关数据采集,包括不限于海内外文本,图片,音视频数据;
2.负责对目标网站或 APP 进行反爬突破、协议破解和提取关键数据;
3.负责反爬虫策略研究,代理、验证码识别等采集支撑服务建设;
4.参与大规模数据处理流程的设计与开发,包括但不限于数据采集、清洗、转换、存储等过程。
技能要求:
1. 本科及以上学历,计算机相关专业; 1 年以上数据采集工作经验
2,. 核心技能
o 精通 JavaScript 逆向工程
o 有主流站点 Web 端大规模数据采集经验
o 具备多类型验证码处理能力:包括滑块、点选、Google reCAPTCHA、
旋转验证码等
o 熟悉 APP 脱壳、逆向、反编译及自动化相关技术
o 具备 AST 反混淆 JavaScript 代码及 JSVMP 算法还原能力
• 附加技能(优先考虑):具有风控应对经验(如 Akamai 并发、Cloudflare 等
反爬虫策略处理经验
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕