职位描述
一、岗位职责
1. 主导政务、教育、医疗行业高质量数据集建设工作,结合行业特性和业务需求,制定科学、可落地的数据集建设方案。
2. 统筹协调标注团队、行业业务专家(教育教研人员/医疗医护人员/政务等)与算法专家,拆解标注任务目标,明确标注目标与技术要求,指导各方高效协作,解决标注过程中的行业知识与技术难题。
3. 跟踪数据集建设全流程质量,建立数据集质量管控体系,定期输出数据集质量报告,牵头修正标注偏差,确保数据集满足准确性、完整性、一致性要求。
4. 跟踪政务/教育/医疗AI领域数据集建设前沿技术与行业规范,基于大模型与AI技术特性,结合业务场景迭代优化数据集方案,提升数据集对大模型训练、推理以及数智化应用效果的支撑能力。
5. 沉淀行业数据集建设方法论,输出标注指南、质量评估报告等文档,为后续同类项目提供经验参考。
二、职位要求
1. 学历与专业:本科及以上学历,计算机科学与技术、数据科学、教育技术学、医学信息工程等相关专业优先。
2. 行业经验:具备5年及以上政务或教育或医疗行业工作经验,熟悉至少一个细分领域业务场景(如政务领域、K12教学/职业教育、临床科室诊疗/医学影像诊断等),了解行业核心数据特征。
3. 技术能力:掌握大模型基础原理与AI数据处理逻辑,具备数据集设计、标注流程搭建经验,能清晰对接算法团队需求,将行业知识转化为数据标注规则;有Labelme、Label Studio等类似数据标注工具的使用经验。
4. 协作能力:具备优秀的跨团队沟通与项目推动能力,能有效协调标注团队、业务专家与算法专家达成目标,应对项目推进中的突发问题。
5. 细节与责任:对数据质量有极致把控意识,能制定可落地的标注规范与质量校验标准,确保数据集符合行业合规要求与模型训练需求。
6. 文档能力:具备清晰的逻辑表达与文档撰写能力,可独立输出数据集方案、标注指南等专业文档
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕