职位描述
岗位职责:
1. 负责大模型微调算法的开发与优化,支持产品功能的快速迭代和升级。
2. 根据垂直领域的业务需求,深入挖掘应用场景,设计针对性微调方案,优化算法和工程实现。
3. 跟踪并探索微调与优化领域的前沿研究成果,快速完成验证和转化应用。
4. 应用场景覆盖客服机器人、人机问答、多轮对话、文本生成、文本摘要等多个领域。
5. 关注并实践大模型领域的最新发展趋势与技术应用。
任职要求:
1. 学历背景:本科及以上学历,计算机相关专业优先。
2. 技术能力:
1) 熟悉大模型文本预训练的核心原理,具备以下领域的深入理解和实践经验:数据准备、模型预训练、指令调优、强化学习(RLHF 等)、推理优化和模型评估等。
2)精通主流大模型的算法和应用,包括但不限于 GPT、ChatGLM、Llama 和 Qwen,能够针对实际业务需求设计适配性的优化方案。
3)熟悉大模型应用开发框架,例如 LangChain 和 ModelScope-Agent,熟练使用相关工具完成模型训练、微调(Fine-tuning)及性能评估(如 SWIFT 和 LLaMA-Factory 等),掌握基于 Prompt 和 Fine-tuning 的策略优化方法。
4)熟悉主流 AI 开源生态(如 Meta 等),具备在 Linux 环境下进行开发的能力,能够熟练使用 OpenAI API,并精通 Python 和 C# 编程语言。
3. 对人工智能技术有强烈的求知欲和热情,具备良好的沟通能力,能够积极参与团队分享、交流与讨论。
4. 具有良好的英文技术文献阅读能力。
5. 经验加分项:
1) 有 LLM 预训练与微调(如 SFT、Prefix Tuning、LoRA 等)经验者优先。
2) 有通过 Prompt或RAG(检索增强生成)将 AI 技术应用于不同业务场景的经验者优先。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕