岗位描述:
每一个可靠的中医大模型背后,是海量专业数据的淬炼,这要求我们从典籍脉络的解构中提炼辨证逻辑,从临床诊疗的推演中构建决策链条,这是一个中医学术体系与AI数据科学深度交叉的复杂工程。
我们的目标是让数据成为模型理解中医哲学、辨证逻辑与方剂应用的“源泉”,并推动其从文本生成向中医认知智能跃迁。
我们需要您利用预训练、微调、对齐技术,训练出可落地于实际诊疗场景的中医临床大模型。
岗位职责:
1. 大模型训练及优化
- 主导基座大模型的选型评估
- 设计训练策略,实现训练流程
- 执行中医临床大模型预训练、微调、对齐工作
- 基于多维度的大模型评估结果,持续性优化模型表现
2. 大模型业务落地工作
- 收集实际临床效果反馈数据,驱动模型迭代优化
- 研发基于大模型的中医智能体,针对特定任务提升应用效果
3. 数据工程与质量评估工作
- 建立训练数据质量评估方案,确保数据对模型学习的有效性
- 优化多源异构数据处理管道
职位要求:
1. 学历:计算机科学、人工智能、数学或医学相关专业硕士及以上学历。
2. 经验:
- 3年以上深度学习或大模型项目经验
- 有医疗AI、或其他领域成功落地经验,并全程参与
3. 技术要求:
- 精通主流开源模型架构及其核心组件,深入理解不同模型的优缺点及适用场景
- 具备在多节点多卡环境下进行大模型训练及调优实战经验,熟练使用相关工具链
- 精通至少一种主流微调框架和推理框架,深度理解框架源码
- 熟练掌握Python编程,熟悉深度学习库、科学计算库及相关工具包
- 掌握Docker、Kubernetes等DevOps工具
4. 我们深知精通全部AI领域工程细节是不现实的,但如果您对以下某几个方面达到顶尖水平,将机有竞争力:
- 需要您具有各个开源大模型的逆向解析能力,充分了解权重归因,并具备知识定位经验及故障诊断经验
- 需要您具备精准的算力资源规划能力,对硬件计算极限、网络通信带宽瓶颈算有着充分的认知和优化策略
- 需要您对训练数据的筹备有丰富的经验,能够协同数据团队筹备由浅至深、分布均匀领域数据,并构建并泛化特定任务的高质量训练数据
- 需要您对推理过程有丰富的优化经验,具备平衡`精度 - 成本 - 响应延迟`三角关系的能力
加分项目:
- 有强化学习项目经验,能根据业务场景设计奖励函数及策略
- 对中医有一定程度的了解,有中医临床经验,或在中医医疗机构中具有工作经验会优先录取