职位描述
岗位职责
1. 大模型应用开发:
○ 负责大语言模型(LLM)或跨模态大模型在实际业务场景中的需求分析、模型选型与优化(如智能客服、知识问答、文档理解、自动化合规审核等);
○ 完成模型的微调(Fine-tuning)、提示工程(Prompt Engineering)、评估与部署,解决领域适配问题。
2. 性能优化与工程化:
○ 优化模型推理效率(如量化、剪枝、蒸馏)及显存占用,提升服务吞吐量;
○ 设计多模型协同架构(如RAG、Agent系统),解决复杂任务链问题。
3. 技术研究与创新:
○ 了解大模型前沿技术: 关注大模型领域的一些前沿技术(如 MoE 的基本概念、长上下文处理的重要性、多模态对齐的基本原理),并思考其在业务场景中的潜在应用。
○ 构建领域数据集并进行初步训练策略探索: 参与构建针对特定垂直领域的、较小规模的数据集,并尝试设计一些基本的领域适配训练策略。
任职要求
1. 教育背景:
○ 本科及以上学历,计算机、电子、软件工程、数学等相关专业优先。
2. 技术基础:
○ 了解主流大模型架构(如Transformer、LLaMA、GPT、CLIP),具备提示词工程优化经验;
○ 掌握大模型微调技术(如SFT、LoRA、QLoRA、Adapter),具备显存优化经验(混合精度训练、梯度累积);
○ 熟悉大模型应用技术栈:LangChain/LLamaIndex、向量数据库、评估工具(MT-Bench、HELM);
○ 使用过Dify/Coze/fastgpt等平台,熟悉工作流构建、智能体与自定义工具编写。
3. 项目经验:
○ 2年以上NLP/CV算法经验,至少1年大模型相关项目实战经验;
○ 有至少一个完整的大模型落地案例(如基于LLM的智能审核系统、智能问答或者多模态内容生成)。
4. 工程能力:
○ 熟悉使用模型加速工具(vLLM、DeepSpeed、TensorRT),具备服务部署经验(API封装、并发优化);
○ 熟悉Linux开发环境,能独立完成数据清洗、训练、评估全流程。
加分项
• 发表过高水平LLM相关论文,或参与开源大模型项目贡献;
• 具备大规模数据处理与优化的经验。
• 具备多模态任务(文本+图像/视频)处理经验,或复杂决策任务(Agent规划、工具调用)开发能力。
软技能要求
1. 问题拆解能力:能将模糊业务需求转化为可落地的技术方案(如将“智能合规审核”拆解为文档解析+规则匹配+LLM决策);
2. 协作沟通:能与产品、工程团队高效协作,推动技术方案落地;
3. 学习与抗压:适应技术快速迭代,能独立攻关技术难点。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕