职位描述
岗位职责:
1、参与大模型在医疗产品中应用方案的制定;
2、参与业务系统和大模型相关的架构方案设计;
3、独立负责大模型研发全流程的工作,包括但不限于:方案设计、开发、部署、调优、预训练,评测、业务联合调试等;
4、独立负责大模型的大规模训练加速、压缩、微调等技术方案;
5、独立负责大模型评测方案的制定;
6、积极探索和跟进技术前沿方向,在实际业务场景落地并沉淀通用的算法能力或者解决方案;
7、团队大模型能力赋能。
任职要求:
1、本科及以上学历,计算机、网络安全等相关专业;
2、具有8年以上NLP算法工作经验,2年以上大模型开发工作经验,具有大模型应用开发和部署经验,熟悉学术界/业界大模型最新成果和发展趋势,具有将大模型应用于产品(特别是垂直领域、医疗行业)的成功经验,包括但不限于:人机对话、多轮对话、智能问答、知识库检索、意图理解、情感理解、报告解读等;
3、对大模型技术、开发和应用有深刻理解,特别是行业大模型领域,包括但不限于大模型的数据准备、预训练、微调、强化学习等;
4、精通各类大模型框架,大模型预训练和各种微调技术,多模态预训练模型技术,精通分布式训练技术,具备大模型的训练和应用开发经验;
5、对大模型的评测方法有深刻的理解;
6、精通python代码,具有良好的英文阅读能力,能快速复现验证业界最新算法;
7、快速学习能力,良好的沟通能力和团队合作意识;
8、有相关行业顶刊发表过论文,有专利成果者优先。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕