9000-15000元
云狐科技园6号楼505
岗位描述:
每一个可靠的大模型背后,是海量专业数据的淬炼,而中医大模型的数据,需要从典籍脉络的解构,到临床逻辑的推演,从流派精髓的提炼,到对抗样本的设计。这是一个在中医学术与AI数据科学交叉点上的复杂工程。
我们的目标是让数据成为模型理解中医哲学、辨证逻辑与方剂应用的“源泉”。我们需要你:
1.
负责构建高质量中医领域大模型训练数据集;
2.
深度参与数据设计、生成、校验与优化全流程;
3.
确保数据符合中医专业逻辑与模型训练目标。
岗位职责:
1.
中医知识体系深度解析:
○
系统梳理中医古籍及现代权威著作的核心理论与知识脉络,构建结构化知识图谱。
○
分析不同中医流派的理论差异及代表性典籍,提炼关键知识要点。
2.
流派专精与知识要点提取:
○
重点研究经方等核心流派覆盖的典籍,拆解其诊疗逻辑、方剂应用场景、药物配伍规律。
○
建立流派专属知识标签体系,用于数据分类与模型能力定向训练。
3.
大模型操控与场景化数据生成:
○
编写精准的提示词,引导大模型基于中医现有知识,以及中医在线积累的数据,生成符合特定场景的文本、问答对、病例数据。
○
分析模型生成数据的质量,形成自迭代的工作流程。
4.
数据全面性与正确性判断:
○
专业校验:对模型生成的中医数据进行专业准确性审核。包括理论逻辑、方剂组成、药物属性、诊疗原则等。
○
覆盖度评估:判断数据集是否覆盖关键病种、证型、治法、流派,提出补充方向。
○
一致性核查:确保数据符合特定流派的理论框架,避免数据之间自相矛盾。
职位要求:
1.
中医专业能力(硬性要求):
○
学历:中医学、中医文献学、中医临床基础等相关专业博士学历、或具备同等深度的专业能力+实践经验。
○
深度:对中医经典著作有深入研究,能独立解读古籍原文,清晰掌握各流派核心思想与差异。
2.
核心素质:
○
结构化能力:擅长将复杂的中医知识体系拆解、归类、结构化。
○
严谨思维力:对专业准确性有极致要求,能敏锐发现数据中的逻辑漏洞、专业错误或潜在误导信息。
○
协作沟通力:能与算法工程师、产品经理、中医专家高效沟通。
加分项目:
•
发表过中医理论研究或临床总结文章。
•
有中医临床、教学经验,深刻理解理论到实践的转化。
•
熟练使用主流大模型工具,包括Deepseek、Qwen、Kimi或文心一言,有一定的提示词编写经验。
•
有数据标注、审核或医学文本处理经验者优先。
•
有参与中医知识库、智能辅助诊疗系统建设经验。
•
具备基础编程能力(Python)可自动化部分任务。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕