岗位职责:
1. 模型开发与微调
- 负责大模型(如Qwen、DeepSeek、LLaMA)的定制化开发,针对中医场景(如问诊记录分析、方剂推荐)进行参数高效微调(如LoRA、Adapter、QLoRA);
- 设计并实现模型优化方案(如FP8/INT8量化、动态批处理),提升推理效率与部署性能。
- 结合业务需求(如HIS系统集成),开发智能功能(如舌诊图像分析、中药配伍规则建模)。
2. 全流程模型管理
- 主导模型从数据预处理、训练、评估到部署的全生命周期管理。
- 构建高质量垂直领域数据集(如中医古籍文本、电子病历),完成数据清洗、标注与增强。
- 使用DeepSpeed、FSDP等技术实现分布式训练,优化GPU资源利用率。
3. 强化学习与对齐技术
- 研究并实现 监督微调(SFT) 与 人类反馈强化学习(RLHF) 技术,提升模型对齐用户需求的能力(如ReFT论文中的强化微调方法)。
- 设计 奖励函数 和 PPO训练框架,优化模型在复杂任务中的决策能力(如中医辨证论治规则建模)。
- 探索 在线强化学习(Online RL) 和 离线强化学习(Offline RL) 在医疗场景的应用。
4. 技术落地与协作
- 将微调模型集成到HIS系统,支持智能问诊、诊疗辅助等功能,确保与医疗业务流程无缝对接。
- 与医疗顾问协作,验证模型输出的合规性(如中医理论规范、患者隐私保护)
- 输出技术文档与案例,支持客户培训及技术方案宣讲。
5. 前沿技术探索
- 跟踪大模型领域最新研究(如多模态模型、Agent框架),探索其在医疗场景的应用潜力。
- 研究对齐技术(如DPO/RLAIF)、RAG(检索增强生成)等,优化模型交互体验与响应质量。
职位要求:
1. 学历:计算机科学、人工智能、数学或医学相关专业硕士及以上学历。
2. 经验:3年以上深度学习或大模型项目经验,有医疗AI或NLP项目落地者优先。
3. 数学基础:
- 熟练掌握 线性代数(矩阵运算、特征值分解)、微积分(梯度下降、优化理论)、概率论与统计学(贝叶斯推断、假设检验)。
- 理解 马尔可夫决策过程(MDP)、贝尔曼方程、策略梯度定理 等强化学习数学基础。
4. 技术能力:
- 精通PyTorch/TensorFlow框架,熟悉HuggingFace生态及主流开源模型。
- 掌握参数高效微调(PEFT)技术,熟悉LoRA、Adapter等方法。
- 熟悉分布式训练(如DeepSpeed、FSDP)和模型压缩(如量化、蒸馏)。
- 有医疗数据处理经验(如电子病历、舌诊图像)或中医知识基础者优先。
5. 强化学习要求:
- 熟悉 监督微调(SFT)、人类反馈强化学习(RLHF)、ReFT(Reinforced Fine-Tuning) 等技术。
- 掌握 PPO(Proximal Policy Optimization)、DQN(Deep Q-Network) 等强化学习算法,能独立实现训练框架。
- 有 在线强化学习 或 离线强化学习 项目经验,能设计奖励函数并优化策略。
6. 工具掌握:
- 熟练使用Python。
- 熟悉模型部署技术(如FastAPI、Triton、vLLM、KTransformers等)。
加分项目:
- 对中医有一定程度的了解,有中医临床经验,或在中医医疗机构中具有工作经验会优先录取。
- 有强化学习论文复现或 ReFT技术实践经验。
- 参与过医疗AI竞赛(如Kaggle医疗挑战)或开源项目贡献。
- 掌握Docker、Kubernetes等DevOps工具