一、岗位职责
基于开源大模型基座(如 Llama、ChatGLM、Qwen 等),负责垂直领域(重点覆盖医学)数据集的收集、清洗、标注、质量校验,搭建高质量领域数据集体系;
主导垂直领域大模型的微调训练,包括数据预处理、模型选型、超参数调优、训练过程监控与效果迭代,提升模型在特定场景的专业问答、知识输出能力;
负责模型训练环境搭建、依赖管理,解决训练过程中的性能瓶颈、过拟合 / 欠拟合等问题,保障训练效率与模型效果;
参与大模型微调后的效果评估与迭代优化,制定领域内模型评估指标(如准确率、召回率、专业度契合度),持续提升模型实用性;
协同产品、算法团队,明确业务需求与技术落地路径,输出模型开发文档、训练报告及部署指南;
跟踪开源大模型技术前沿,探索新的微调方法、数据增强技术在垂直领域的应用,推动技术方案迭代。
二、任职要求
(一)核心技能要求
熟练掌握 Python 编程语言,精通数据处理相关库(NumPy、Pandas、Datasets),具备大规模领域数据集整理与优化经验;
深入理解 Transformer 架构,熟练使用至少一种深度学习框架(PyTorch/TensorFlow),具备基于开源大模型的微调实战经验(如 LoRA、QLoRA 等高效微调方法);
熟悉 Hugging Face 生态(Transformers、Trainer API),能够独立完成模型选型、训练流程搭建、效果验证全流程;
具备数据标注流程设计与质量管控能力,能应对垂直领域数据稀缺、专业性强的问题,有数据增强、小样本学习实践经验者优先;
掌握模型训练环境配置(GPU 集群、Docker),了解模型量化、剪枝等轻量化技术,具备基本的模型部署与推理优化思维。
(二)优先条件(核心加分项)
具备医学领域大模型开发经验(如医疗问答、医学文献分析、临床辅助决策等方向),熟悉医学术语、医疗数据规范者优先;
有垂直领域(如法律、金融、工业)大模型微调、数据集构建实战案例者优先;
了解医疗数据合规要求(如隐私保护、数据脱敏),具备医疗相关数据集处理经验者优先;
(三)综合素养
具备较强的业务理解能力,能快速对齐垂直领域需求与技术实现路径;
具备良好的问题排查能力,能独立解决训练过程中的技术难题;
具备团队协作精神
关注 AI 技术前沿,学习能力强,能快速跟进开源大模型的新特性与新工具。