岗位职责:
1.大模型全栈设计和搭建,实现高效、稳定的模型训练框架,优化算法性能,提升模型训练效率;
2.深入研究RAG、Agent、text2sql、知识蒸馏、强化学习等前沿技术,进行技术研发和创新,提升产品竞争力;
3.构建可快速适配和落地的行业大模型技术体系,探索并支持在行业中的应用场景,包括但不限于智能问答、检索增强等知识服务;
4.负责模型国产化适配工作,确保算法模型在不同硬件和操作系统上的顺利运行;
5.配合部门业务需求,与产品团队紧密合作,提供技术支持与解决方案,提升整体产品的智能化水平;
6.跟踪业界最新技术动态,不断学习和研究新技术,保持技术领先性。
任职要求:
1.学历:博士学历
2.专业:计算机、人工智能等相关专业。
3.知识与技能水平要求:
(1)两年以上大模型相关经验,熟悉主流大模型(如DeepSeek、GPT、LLAMA、GLM、Qwen等)、RAG、Agent的基本原理,有生成式大模型预训练、微调、强化学习等方面深入实践者优先;
(2)熟练掌握机器学习和自然语言处理常见算法与模型,有深度学习技术落地经验,在一个或多个领域能够独立开展研发工作;
(3)较强的技术攻关能力和分析问题解决问题的能力,能够跟进领域内最新技术研发成果,并结合应用场景快速实验和调优;
(4)具有扎实的代码功底和工程开发能力,精通linux平台下Python、C++等语言开发;熟练掌握常用深度学习框架(pytorch、tensorflow等)和大模型训练框架(transformers、llama-factory等);
(5)良好的逻辑思维能力、沟通能力和团队协作能力。