职位描述
要求
1.对文本数据、网页、表格数据数据进行清洗、去重、去噪,进行规范化和结构化处理,确保数据质量和可靠性
2.进行数据格式的转化和标准化,为RAG向量数据库及大模型训练提供高质量数据支撑
3.与团队协作,理解业务需求,针对不同应用场景,提供有效的数据解决方案
4.定期对数据质量进行评估,优化数据处理逻辑
技能要求
1.熟悉linux开发环境,熟练掌握python及相关的数据处理库,有开源模型/工具部署经验
2.有非结构化数据处理经验,如文本分段分词、数据标签化等NLP、NER技术
3.有对象存储、es、postgres等工具的使用经验,进行数据提取与存储
4.了解数据仓库相关技术,能够进行模型设计与指标开发工作
5.能进行技术探索,提出相关的解决方案与团队沟通解决业务问题
基本要求
1、专科及以上学历,原则上为计算机等相关专业毕业;计算机、管理、经济等相关专业毕业;有2年(含)以上相关实际工作经验。
2、必须重庆现场面试,不接受线上面试。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕