职位描述
岗位职责:
1、算法设计与开发;
2、负责大模型(LLM、多模态模型)的预训练、微调、压缩及推理优化,探索模型架构创新;
3、针对垂直场景(如慢病医疗)设计高效Prompt工程方案,提升模型能力;
4、跨团队协作,与数据团队合作设计数据清洗与增强方案,提升训练数据质量。
任职要求:
1、计算机科学、数学、统计学等相关专业硕士及以上学历,3年以上算法研发经验;
2、精通PyTorch/TensorFlow框架,熟悉DeepSpeed、Megatron-LM等分布式训练框架;
3、深入理解Transformer、BERT、GPT等主流大模型架构,熟悉LoRA、P-Tuning等参数高效微调方法。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕