岗位职责
1. 负责公司大模型应用方向的技术路线与架构设计:模型选型、能力规划、迭代节奏、成本与质量目标。
2. 搭建可复用的 LLM 应用平台能力:
- Agent/工作流编排、工具调用网关、权限与审计
- Prompt/模板与版本管理、配置化发布、灰度与回滚
- 统一会话/记忆管理、上下文压缩、长期记忆策略
3. 负责 RAG 全链路工程化与治理:数据接入标准、索引策略、召回/重排优化、证据引用、知识版本与可追溯。
4. 建立端到端评测与质量体系:离线 benchmark、线上 A/B、回归集、红队体系;定义指标(命中率/引用覆盖率/拒答率/风险率/成本/延迟等)。
5. 推理服务与成本治理:GPU 资源规划、容量与 SLO、缓存与路由、量化与加速方案落地。
6. 带团队/协作落地:指导工程实践、code review、关键难题攻坚,与产品/业务/安全/后端平台紧密协作。
任职要求
1. 深度理解 LLM 应用落地关键问题:幻觉与可控性、RAG 质量、工具调用安全、长上下文与记忆、线上评测与回归。
2. 有从 0 到 1 或从 1 到 N 的大模型应用/平台化经验(生产环境落地),能把方案拆解为可交付里程碑。
3. 强工程背景:服务端架构、可观测性、发布体系、稳定性治理、性能与成本优化。
4. 具备团队协作与技术领导力:能推动跨团队共识与标准落地。
加分项
- 有大规模推理/多租户平台经验(路由、隔离、配额、审计)
- 有分布式训练/对齐经验(DeepSpeed/FSDP、DPO/RLHF、数据治理体系)
- 有安全/风控体系经验(越权工具调用防护、数据泄露防护)
- 有垂直行业高风险场景落地经验(医疗等)