一、大模型(LLM)相关职责
模型开发与优化
参与大语言模型(如GPT、LLaMA、Claude等)的预训练、指令微调(SFT)、强化学习对齐(RLHF/RLAIF)。
优化模型性能(推理速度、显存占用)及效果(准确性、泛化性、安全性)。
探索模型压缩技术(量化、蒸馏、剪枝)以适应实际部署需求。
领域适配与微调
针对垂直场景(医疗、金融、教育等)进行领域数据清洗、构建及模型微调。
设计高效的迁移学习方案,提升模型在特定任务上的表现。
提示工程与推理优化
设计高质量的Prompt模板,提升模型在复杂任务中的表现(如CoT思维链、Self-Consistency等)。
研究少样本/零样本学习策略,降低模型对标注数据的依赖。
二、智能体(Agent)系统相关职责
Agent架构设计
构建基于LLM的智能体框架(如ReAct、AutoGPT、LangChain等范式)。
设计Agent的核心组件:规划(Planning)、记忆(Memory)、工具调用(Tool Use)、自我反思(Reflection)等模块。
多Agent协同
开发多智能体协作系统,实现任务分解、分布式决策与结果聚合。
解决Agent间的通信、竞争与协同优化问题。
工具集成与扩展
为Agent集成外部工具(API、数据库、搜索引擎等),扩展其能力边界。
开发工具学习(Tool Learning)机制,使Agent能自主选择并调用工具。
三、工程落地与优化
高性能推理部署
使用vLLM、TGI、TensorRT-LLM等技术优化模型推理效率。
设计分布式推理架构,支持高并发、低延迟的线上服务。
数据处理与评估
构建高质量训练/评估数据集,设计自动化评估体系(传统指标+LLM-as-Judge)。
监控模型线上表现,持续迭代优化效果及安全性。
系统集成
将Agent系统对接业务场景(如客服、代码生成、游戏NPC、自动化办公等)。
与前后端工程师协作完成端到端产品化落地。
四、前沿技术探索
跟踪大模型与Agent领域最新进展(如MoE、长上下文优化、Agentic Workflow等)。
探索多模态Agent(文本+图像/语音/视频)的应用场景。
研究Agent的长期记忆、个性化交互、可信决策等进阶能力。