职位描述
岗位职责:
模型服务化与部署:主导大模型(LLM)的服务化开发,设计高性能、可扩展的模型API服务,支持高并发、低延迟的在线推理需求。
优化模型部署方案(如容器化/Docker、Kubernetes、模型量化剪枝),解决显存管理、动态负载均衡等工程问题。
构建模型监控体系,跟踪服务性能(如吞吐量、错误率)及业务指标(如AI输出准确率)。
跨系统集成指导:主导AI能力与现有软件系统(如ERP、CRM、OA)、数据平台(数据湖/数仓)及业务流程的集成,设计标准化接口规范。
针对复杂业务场景(如智能客服、自动化报告生成),设计端到端AI解决方案,协调前后端、数据团队完成联调。
制定数据流转方案,确保输入输出数据与业务系统兼容(如结构化数据转换、非结构化文本处理)。
基本要求:
3年以上AI工程化经验,至少主导过1个以上AI系统集成项目(如将大模型嵌入企业工作流)。
精通Python。
加分项:
具备跨团队协作经验,能撰写技术方案书并面向非技术角色宣讲。
有LLM应用中间件开发经验(如流量控制、缓存机制、审计日志)。
查看更多职位描述

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕