职位详情
AI模型应用开发工程师
2-3万
塞力斯医疗供应链管理(北京)有限公司
北京
3-5年
本科
09-25
工作地址

大族广场

职位描述
工作职责​ .大模型核心研发攻坚:开展医疗领域大模型的底层架构设计、预训练策略制定、核心算法研发,提升模型的性能(精度、效率、可控性)与泛化能力。​ .技术战略规划与落地:跟踪全球大模型技术前沿(如 GPT 系列、LLaMA 系列等),结合企业业务场景与技术储备,制定大模型短期与长期技术路线图,明确核心突破方向(如多模态融合、小样本学习、模型压缩等),并推动战略在研发项目中落地。​ .模型全生命周期管理:主导大模型从数据层到应用层的全链路设计,包括高质量训练数据的采集、清洗、标注体系搭建,模型训练集群的架构规划与资源调度,模型微调、对齐、安全加固方案的制定,以及推理引擎的优化与部署(如分布式推理、量化压缩),确保模型在实际场景中高效、稳定、安全运行。​ .跨部门协同与业务落地:深度对接产品、业务、市场等,将业务需求转化为大模型技术指标,主导大模型在核心业务场景(如智能决策、自动化流程、个性化服务)的落地验证,解决技术与业务融合中的关键问题(如模型适配性、成本控制)。 任职要求: 1. 计算机科学、人工智能、机器学习等相关专业博士及以上学历,5 年以上 AI 领域研发经验; .2.精通大模型核心技术,包括但不限于 Transformer 架构、预训练方法(如 BERT、GPT 训练策略)、微调技术(如 LoRA、Prefix Tuning)、注意力机制、多模态融合等,对模型训练中的数据处理、算力调度、优化算法有深刻理解。​ .3.具备扎实的算法与工程能力,熟练掌握 Python/C++ 等编程语言,精通 TensorFlow/PyTorch 等深度学习框架,熟悉分布式训练框架(如 Megatron-LM、DeepSpeed),有大规模集群(千卡 GPU 以上)训练经验者优先。​​ .4具备较强的问题解决能力与创新精神,在大模型训练效率提升、模型压缩、安全可控等领域有技术突破或专利成果者优先。​ .5. 良好的沟通与跨部门协作能力,能清晰表达复杂技术方案,推动跨团队项目落地。​

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请