岗位职责:
一、电商平台数据爬取
1、负责设计分布式爬虫系统,采集抖、快、拼等电商平台的商品信息(订单信息、店铺信息、评论等);
2、应对反爬机制(IP封锁、验证码、动态加载),使用代理IP、Selenium模拟浏览器等技术突破限制;
3、优化爬虫性能,包括并行化爬取、数据去重、异步IO等技术提升效率;
4、数据清洗与存储:通过正则表达式/XPath解析数据,存储至MySQL/MongoDB等数据库。
二、 智能体搭建与系统开发
1、开发AI智能体开发,新媒体推广智能体与办公智能体的开发实施;
2、参与自动化系统(如订货单生成、报表统计),结合爬虫与业务需求提升效率
维护爬虫服务器,监控任务调度与报警反馈,确保系统稳定性;
三、数字人建模开发(优先项)
1、熟悉自然语言处理(NLP)或机器学习算法,支持智能客服、问答机器人等应用;
2、具备数据挖掘经验,能构建用户行为分析或个性化推荐系统/3
有数字人从0-1搭建开发并上线经验优先;
任职要求 :
一、技术能力
1、精通Python开发,熟悉Scrapy、Requests、Selenium等爬虫框架;
2、掌握HTML/CSS/JS解析技术(XPath、正则表达式、Beautiful Soup);
3、熟悉数据库优化(MySQL、MongoDB)及分布式存储原理;
4、了解HTTP协议、抓包工具(Fiddler、Charles)及逆向工程(APP反编译、JS解密)。
二、经验要求
1、5年以上Python开发经验,3年以上电商数据爬取实战经验;
2、有AI智能体开发经验;
3、具备数字人建模、机器学习或大数据处理(Hadoop/Spark)经验者优先
三、软性要求
1、计算机相关专业本科及以上学历;
2、良好的编码规范,能独立解决问题并优化系统性能;
3、适应高强度工作,具备团队协作与跨部门沟通能力