职位描述
岗位职责:
1、模型研发与优化:负责大语言模型的预训练、指令微调(SFT)、强化学习(RLHF)等算法的研究与优化,针对训练结果进行算法调优与训练方法优化。
2、技术方案设计:主导大模型在行业应用领域的技术方案设计与实施,涵盖选型评估、架构设计、快速部署验证、性能优化和指令调优等全流程。
3、多模态与语音算法研发:参与多模态学习、语音处理等算法的研究与应用,推动跨模态任务的解决方案,优化语音、图像、文本等多种数据模态之间的融合。
4、数据处理与优化:负责大模型训练所需的数据流程设计、数据清洗、数据增强和标注策略,以及多模态、语音等数据的处理和优化。
5、前沿技术探索:持续跟踪和复现LLM、Agent等前沿技术论文及项目,挖掘并应用最新的研究成果。
6、业务场景落地:将大模型应用于具体业务场景,如智能问答、内容生成、知识图谱、多模态交互、语音识别与生成等。
任职要求:
1、计算机科学、人工智能、数据科学等相关专业硕士及以上学历。拥有2年以上人工智能大模型相关的工作经验,尤其在自然语言处理(NLP)领域有深入研究者优先。
2、对大模型算法架构非常熟悉,精通常用的微调算法,具备较强的调优能力。熟练掌握LoRA、Instruction Tuning、Prompt Tuning 等微调算法。
3、熟练掌握Python编程,能写出高质量的代码,熟悉PyTorch、TensorFlow、Huggingface等深度学习框架。
4、熟悉Transformer架构、自注意力机制、位置编码等。有大模型预训练、微调、强化学习等相关项目经验。
5、熟悉多模态学习、语音处理等相关算法技术以及调优能力,具备处理跨模态任务的经验。
6、掌握大模型训练技术,如模型并行、数据并行、管道并行,熟悉DeepSpeed、Megatron等训练框架。
7、良好的团队合作精神、沟通能力和自我驱动力,对新技术有快速学习和应用能力。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕