一、岗位职责
1、 掌握 AI 大模型、Agent 智能体、知识库、向量数据库、RAG 等技术,能够根据业务需求设计和实现相关技术方案。
2、 具备基础模型训练、微调、推理部署与加速的应用开发能力,能够将模型部署到线上并进行生产化优化。
3、 针对具体业务需求,进行大模型继续训练(CT)、有监督微调(SFT)、偏好学习及多模态模型训练,优化模型在特定场景下的表现。
4、 熟悉前沿的大模型应用技术与开源工具,如 DeepSeek、Llama、LangChain、Ilamalndex 等,具备实际操作经验。
5、 制定并实施大模型的评估方案,结合人工与自动化评估手段,确保模型的性能可靠性和稳定性。
6、有推荐系统、问答、搜索等实际项目的开发经验,熟练掌握架构设计、特征工程和画像体系建设,深入理解召回和排序算法,关注并研究行业前沿算法。
二、任职要求
1.相关专业本科以上学历, 如计算机、软件工程等;
2.熟练使用Python进行代码开发,熟悉LLM全流程的工作原理;
3.懂deepseek、有Baichuan、GLM、Qwen等热门预训练大语言模型框架经验更佳, 熟练掌握相关技术原理;
4.熟悉Agent,Copilot的概念,了解目前LLM领域的前沿趋势;
5.对大语言模型有着强烈的热爱和兴趣,并看好这个方向的发展。
三、工作区域:浙江杭州西湖区。
四、薪资待遇
20-30K