职位描述
岗位职责:
1. 负责企业级AI应用系统研发
构建智能体(Agents)执行框架,主导高并发知识库问答系统(RAG)的分布式架构设计与性能优化。
推动多模态生成系统(文本/图像/语音等)的工程化落地。
2. 主导大模型全链路研发
负责模型微调(SFT)、参数高效微调(PEFT)、对齐训练等工作。
搭建完善的 Prompt 工程体系,推动 RAG 方案的全流程优化(检索、召回、生成、重排序等)。
3. 设计高可用的复杂分布式系统架构
设计和优化 AI 服务的高可用部署架构(优先支持华为昇腾 / ARM)。
负责 GPU/ NPU 资源调度、推理加速、向量检索性能优化。
深度定制 LangChain / LlamaIndex 等框架,进行源码级别性能增强。
4. 构建AI系统评测与监控体系
制定并落地 RAG 准确率、生成质量、延迟指标等核心评测体系。
负责离线/在线的评测工具链构建与回归测试自动化。
5. 技术前沿研究与架构升级
跟踪大模型、Agent、检索增强等领域前沿技术,主导关键组件的技术选型。
推动平台架构持续演进,沉淀标准化工程实践。
任职要求
1. 计算机及相关专业硕士学历
具备企业级系统架构经验,有百万级日调用量系统设计经验优先。
2. 精通分布式系统设计
掌握分布式存储与检索(HDFS、Elasticsearch 等)、分布式计算(Spark、Flink)。
熟悉高并发、高可用系统的性能调优方法。
3. 深入理解 RAG 技术体系
熟练掌握混合检索、向量索引、查询扩展、重排序等核心能力。
有端到端检索链路优化经验者优先。
4. 掌握大模型工业化落地方法论
熟悉 SFT/数据构造/对齐训练/PEFT 等训练流程。
能构建可复用 Prompt 模板体系与高质量提升策略。
5. 具备复杂系统调优与问题解决能力
6. 具备高性能工程能力,精通 C++ / Java / Python,能进行框架源码级优化或自研高并发组件。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕