职位描述
职位描述
1、负责大模型研发,主导Code-LLM与逻辑推理大模型的训练创新,攻克NL2Code、复杂推理链生成等技术难点,推进LLM Test-Time Compute、Parameter-Efficient Finetuning等技术落地实践;
2、推动大模型应用落地,探索包括RAG-QA机器人、数据洞察机器人等在真实场景的应用价值,并基于评估体系实现应用效果的持续迭代;
3、跟进开源SOTA大模型,探索大模型Scaling law并实践开源大模型在数据智能领域的Post-Training,沉淀技术专利。
数据增强算法优化,优化预训练/SFT/RLHF阶段的数据合成算法,提升训练数据的准确性、多样性和领域适配性;
职位要求
1、硕士研究生及以上学历,计算机科学/人工智能/应用数学等相关专业,顶会(ACL/NeurIPS/ICML/EMNLP/ICLR )论文或竞赛获奖者优先;
2、扎实的深度学习技术基础,熟悉深度学习训练框架(PyTorch/Huggingface等),了解常见大语言模型、Embedding架构和训练方法优先;
3、优秀的问题分析解决能力,以及良好的沟通协作能力,能和团队一起探索新技术。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕