岗位职责:
1、负责医疗健康领域大模型的SFT,构建高质量的指令数据集,提升模型的任务执行能力。
2、主导设计医疗健康大模型强化学习训练框架,持续提升模型在医疗健康领域的推理能力。
3、设计和实施全面的模型评测体系,从多维度追踪模型的迭代效果。
4、跟进业界最新的大模型训练与对齐技术,进行预研和实践,持续提升核心模型的能力边界。
5、负责大模型训练加速与推理优化,应用量化、蒸馏等技术实现工业级部署。
6、完成上级安排的相关工作。
任职要求:
1、计算机相关专业本科及以上学历,3年以上大模型或NLP相关技术研发经验。
2、具备大语言模型训练的实战经验,特别是SFT和RL等技术。
3、有强化学习项目实战经验,熟悉强化学习算法从研发到落地的全流程。
4、精通PyTorch等深度学习框架和分布式训练技术(如DeepSpeed)。
5、对Transformer模型结构有深刻理解,对大模型训练中的数据、算法、算力有系统性认知。
6、在国际顶会发表相关论文者优先。
7、对新技术有强烈的热爱、好奇心和钻研精神,具备卓越的团队协作、沟通和问题解决能力,自驱、富有责任心和主人翁精神,极致追求算法创新和产品效果。