职位描述
核心职责:
协助团队进行GPT/LLaMA/Gemma等开源大模型的预训练、指令微调(SFT)及RLHF对齐优化
支持探索多模态模型的应用场景(如安全生产管控、风险安全识别等),协助团队推动应用落地
使用DeepSpeed/Megatron等框架进行训练任务的支持,学习并帮助解决分布式训练中的问题
任职要求:
基础能力:
计算机/人工智能相关专业,在校生或应届毕业生,具备基本的PyTorch框架使用经验和Python编程能力
理解Transformer架构,了解LoRA/QLoRA等微调方法
加分项:
有开源项目贡献或相关科研经历者优先
对多模态模型、NLP相关技术有浓厚兴趣者优先核心职责:
模型开发协助:
协助团队进行GPT/LLaMA/Gemma等开源大模型的预训练、指令微调(SFT)及RLHF对齐优化
支持探索多模态模型的应用场景(如安全生产管控、风险安全识别等),协助团队推动应用落地
使用DeepSpeed/Megatron等框架进行训练任务的支持,学习并帮助解决分布式训练中的问题
技术研究支持:
协助开发并优化模型评测工具
学习并探索数据合成、模型蒸馏等轻量化技术,协助提升算力消耗效率
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕