1.2-1.6万
成都天投国际商务中心
岗位使命
通过数据工程 + Prompt 设计与评测,稳定提升中文专业文书的首稿质量与通过率;建设高质量数据集与评测体系,实现自动化评判与持续迭代。
职责• 数据集建设:面向中文专业文本,完成资料收集、清洗、OCR/结构化、去重脱敏与标签规范;沉淀可复用的数据标准与样本库。
• 提示词/模板迭代:设计与剪辑提示词与输出模板,进行 A/B 实验与显著性分析,输出改进报告;将优胜方案版本化并协同上线。
• 自动化质量评估:搭建规则校验 + 模型辅助评审的评测流程,覆盖结构完整性、引用一致性、输出规范化与可验证性等;建设周/月度质量看板。
• 数据治理:数据安全合规、版本追溯、抽检与偏差控制;难例发现与回灌。
要求• 中文阅读理解与信息结构化能力强,能快速提炼要点并形成标准化要素。
• Python(pandas/regex/SQL)数据处理扎实,具备 OCR/版面解析能力或可快速上手。
• 具备 LLM 结构化输出经验,能进行提示词(Prompt)设计与 A/B 评测,并完成显著性与回归验证。
• 能够设计“规则评测 + 模型评审(LLM-as-judge)”的组合指标,并给出可解释结论。
• 重视可复现与数据安全:实验记录、版本管理、依赖锁定;脱敏、最小权限、合规意识。
• 最好具备法律相关学历背景(如法学本科/硕士/研究生,或中文专业中涉及法律文本方向),或在法律专业文本处理(仲裁/诉讼/合规/合同等)方面拥有可证明的项目经验。
加分项• 有法律/金融/政务等中文专业文本项目经历,能提供案例或成果物。
• 熟悉标注工具(Doccano/Label Studio)与标注质控(IAA/Kappa)。
• 具备检索增强(RAG)与向量库(FAISS/Milvus)实践经验。
• 有自动化评测流水线与数据看板(Metabase/Grafana 等)落地经验。
• 熟悉国产/中文大模型生态(如 Qwen/DeepSeek/GLM/Yi/Baichuan 等)或本地化部署。
试用期目标(2–3 个月)• 推动一条“评测—改进—回归验证—上线”的闭环落地。
• 对关键质量指标(如首稿通过率/错误率/编辑工作量)实现可量化改进。
• 产出“标准样本集/挑战样本集”与复现实验文档。
合作与方式与领域专家(SME)、工程与产品紧密协作;成都优先,可远程;核心数据涉密,需签署保密与合规承诺。
投递材料(请务必附)• 简历(含项目/代码/文章)。
• 一页 A4 的提示词 A/B 或中文文本评测案例(含指标与结论)。
• 任选其一示例脚本(可脱敏):文档结构化 + JSON 校验 / 事实-引用一致性规则雏形 / LLM 辅助评审模板。
职位卡片职责:中文专业文本数据集建设、提示词 A/B、自动化评测流水线,提升首稿通过率与降低编辑成本;要求:Python 数据处理、结构化输出、评测与合规;最好具备法律相关学历或法律文本经验。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕