职位描述
1. 熟悉使用Python,掌握FastAPI / Uvicorn / gRPC,能把任意开源模型封装成高可用REST/websocket服务
2. 具备Agent 开发经验:Function-calling、langchain/langGraph、openAI Assistant API、MCP(Model Context Protocol)
3. 掌握RAG全链路:Embedding、向量库、检索融合、重拍、上下文压缩
4 熟悉主流大模型架构差异(RoPE、SwiGLU、GQA、MoE)能根据场景做高效微调(LoRA/QLoRA/DoRA)优先
熟悉Docker + K8s + GPU Operator,能写 Helm chart / Kustomize,具备线上故障排查(OOM、NCCL Timeout、OOMKilled)经验
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕