1 根据业务需求和目标,主导构建高质量模型数据集,参与从数据构建、效果评估到策略迭代的模型训练完整闭环。
2 案例分析与规则总结:拆解用户问题,理解需求范围,设计理想回复标准应满足的标准要求,总结搜索问答任务不同题型分类下清晰、具体、可操作的理想态细则,协助产研优化规则/链路。
3 深入分析模型badcase,定位问题根因,提出针对性的数据优化方案与模型调优建议,协助模型效果优化。
4 数据合成探索:通过prompt设计搭建数据合成自动化链路,提高数据合成效果和生产效率
岗位要求:
1 985、硕士及以上学位优先;1年以上大模型相关经验,例如训练数据构造、RL偏好标注、模型效果评估、提示词工程。
2 文本理解与逻辑分析:能够快速理解复杂规则和抽象概念,善于洞察文本的细微差别、逻辑链条和内在含义,能主动从大量数据案例中发现问题、总结规则。
具备vibe coding能力优先,例如能够使用Python或借助Trae/Cursor/Coze等AI代码工具撰写代码,搭建数据合成自动化链路,或能够设计多轮指令与模型交互对话生成更优回复