职位描述
【工作内容】
1.负责大模型(LLM)的数据处理工作,包括数据收集、清洗、去重、标注、格式转换及质量评估;
2.针对多模态(文本、图像、语音等)或垂直领域数据,设计高效的数据处理流程与标准化方案;
3.分析数据分布特征,识别并解决数据偏差、噪声等问题,确保训练数据的多样性和高质量
4.开发自动化数据处理工具与脚本,优化数据清洗、标注及质量评估的效率和规模化能力;
5.与算法团队紧密协作,根据模型训练需求定制数据策略,提升训练效果。
【任职要求】
1.学历背景:计算机科学、人工智能、数学、统计学或相关专业本科及以上学历;
2.1 年以上大模型(如NLP/CV多模态)数据处理经验,熟悉完整的数据处理链路;
3.掌握 Python 及主流数据处理工具库,理解数据清洗技术;熟悉数据质量评估指标及统计分析工具;
4.有保险金融数据处理相关经验者优先。
【薪酬福利】
薪资待遇:
1、薪资:根据面试表现确定薪资,18-22k * 14 薪,餐补660/月
2、入职缴纳五险一金,员工福利平台;
3、上班时间:8:30-17:30,午休一个半,周末双休,正常国家法定节假日:
4、提供广阔的晋升平台及定制培训计划。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕