课程运营(北京)  
  8000-10000元
北京 本科
中国大陆北京市朝阳区朝阳北路152号时尚万科中心1层,邮编:100025
岗位职责:
1、负责大模型评测体系的建设与迭代,涵盖人工评测与自动化评测,包括流程设计、工具需求提出与落地实施,推动评测体系标准化和规模化发展;
2、深入理解大模型技术与评测集构建方法,从用户与业务场景出发,制定科学合理的评测策略,建设高效敏捷的评测Pipeline,形成可复用的框架与方法论,能够输出系统化、专业化的评测报告,为模型优化、训练改进及产品应用提供有价值的反馈与方向,助力效果持续提升;
3、统筹跨部门资源,与产品研发团队紧密协作,独立承担标注策略制定、项目管理、流程优化与质量把控,确保评测目标高质量达成。
任职要求:
1、本科及以上学历,计算机科学、计算语言学、语言学、人工智能等相关专业优先;
2、具备1年以上大模型评测经验,熟悉各公开评估集的构建方式、评测指标设计、自动化评测工具/平台,有数据产品或数据分析相关经验,能够独立提出并实现解决方案,熟悉PE、Agent/Workflow搭建流程的优先;
3、对大模型训练、评测及应用领域有浓厚兴趣和热情,持续关注前沿研究与技术趋势,具备快速学习与探索能力;
4、思维清晰、逻辑性强,能够在复杂项目环境中快速决策与推进,具备优秀的项目管理能力、跨团队协作意识和沟通能力。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕