职位描述
岗位职责:
1. 负责大模型技术的研发和优化,提高模型的性能和稳定性。
2. 参与设计、开发和维护大模型训练框架,如DeepSpeed、Megatron-LM等。
3. 进行主流模型架构的研究和应用,包括但不限于GPT、BERT、LLaMA等。
4. 结合业务场景进行模型的监督微调(SFT)和强化学习(RLHF),优化模型性能。
5. 负责技术文档的设计、编写与汇报,确保文档质量和专业性。
任职要求:
1.具备4年以上软件研发经验,具备技术文档设计编写与汇报能力。
2.熟练掌握Python、JAVA,熟悉大模型训练框架(如DeepSpeed、Megatron-LM等)。
3.熟悉主流模型架构(如GPT、BERT、LLaMA),掌握提示词工程(Prompt Engineering)、检索增强生成(RAG)、智能体(Agent)等应用范式。
4.具备模型SFT(监督微调)、RLHF(人类反馈强化学习)经验,能结合业务场景优化模型性能。
5.具备国家电网项目建设经验者优先。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕