职位描述
职位描述:
1、负责大模型(LLM)训练阶段的数据质检,优先有SFT、RM实战经验:数据收集、清洗、去重、标注、格式转换与质量评估(含自动化与抽检)。
2、基于多语言场景(英语/西班牙语/印尼语)设计高效的数据处理流程与标准化方案,具备项目管理经验者优先。
3、分析数据分布与覆盖,识别并缓解数据偏差与漂移,保障训练数据的多样性、代表性与一致性。
4、具备>1年大模型训练数据处理经验,熟悉“采集-治理-评测-交付”完整链路与最佳实践。
职位要求:
·多语种能力(限定):-英语/西班牙语/印尼语中至少一种达到工作沟通与读写水平。
·能在多语场景设计提示与评测集,处理语义歧义、术语一致性与文化语境差异。
·学历与背景:计算机科学、人工智能、统计学或相关专业本科及以上,跨学科背景加分。
·加分项(可选):有 RAG数据构建、对话安全/有害内容过滤。
·熟悉标注流程与质控机制。具备供应商管理经验。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕