职位详情
中医大模型训练数据高级专员
1-2万
北京精医和生医药科技有限公司
杭州
不限
硕士
07-03
工作地址

云狐科技园6号楼505

职位描述

岗位描述:


每一个可靠的大模型背后,是海量专业数据的淬炼,而中医大模型的数据,需要从典籍脉络的解构,到临床逻辑的推演,从流派精髓的提炼,到对抗样本的设计。这是一个在中医学术与AI数据科学交叉点上的复杂工程。


我们的目标是让数据成为模型理解中医哲学、辨证逻辑与方剂应用的“源泉”。我们需要你:


1.
负责构建高质量中医领域大模型训练数据集;


2.
深度参与数据设计、生成、校验与优化全流程;


3.
确保数据符合中医专业逻辑与模型训练目标。



岗位职责:


1.
中医知识体系深度解析:



系统梳理中医古籍及现代权威著作的核心理论与知识脉络,构建结构化知识图谱。



分析不同中医流派的理论差异及代表性典籍,提炼关键知识要点。


2.
流派专精与知识要点提取:



重点研究经方等核心流派覆盖的典籍,拆解其诊疗逻辑、方剂应用场景、药物配伍规律。



建立流派专属知识标签体系,用于数据分类与模型能力定向训练。


3.
大模型操控与场景化数据生成:



编写精准的提示词,引导大模型基于中医现有知识,以及中医在线积累的数据,生成符合特定场景的文本、问答对、病例数据。



分析模型生成数据的质量,形成自迭代的工作流程。


4.
数据全面性与正确性判断:



专业校验:对模型生成的中医数据进行专业准确性审核。包括理论逻辑、方剂组成、药物属性、诊疗原则等。



覆盖度评估:判断数据集是否覆盖关键病种、证型、治法、流派,提出补充方向。



一致性核查:确保数据符合特定流派的理论框架,避免数据之间自相矛盾。



职位要求:


1.
中医专业能力(硬性要求):



学历:中医学、中医文献学、中医临床基础等相关专业博士学历、或具备同等深度的专业能力+实践经验。



深度:对中医经典著作有深入研究,能独立解读古籍原文,清晰掌握各流派核心思想与差异。


2.
核心素质:



结构化能力:擅长将复杂的中医知识体系拆解、归类、结构化。



严谨思维力:对专业准确性有极致要求,能敏锐发现数据中的逻辑漏洞、专业错误或潜在误导信息。



协作沟通力:能与算法工程师、产品经理、中医专家高效沟通。



加分项目:



发表过中医理论研究或临床总结文章。



有中医临床、教学经验,深刻理解理论到实践的转化。



熟练使用主流大模型工具,包括Deepseek、Qwen、Kimi或文心一言,有一定的提示词编写经验。



有数据标注、审核或医学文本处理经验者优先。



有参与中医知识库、智能辅助诊疗系统建设经验。



具备基础编程能力(Python)可自动化部分任务。


以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请