职位描述
1.熟练使用python语言,对机器学习类产品有相关的开发经验;
2.了解常见的大模型,有相应的大模型微调训练经验;
3.对常见大模型训练框架原理有了解者优先,包括但不限于deepspeed,megatron,LLaMA-Factory;
4.对大模型有浓厚的兴趣,对细节实现有求知欲;
5.具备良好的沟通能力,较好的逻辑思维能力和理解能力;
主要工作内容:
1.辅助完成大模型的微调,预训练,强化学习等日常训练工作;
2.参与大模型训练框的开发、问题定位、测评等工作;
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕