职位详情
大模型应用开发岗(J10236)
1.5-3万·16薪
三星财产保险(中国)有限公司
上海
3-5年
本科
09-30
工作地址

LUMINA2星瀚广场

职位描述
岗位职责:
1. 大模型服务能力建设
设计实现统一的大模型调用框架,支持上下文控制,流式响应,函数调用,多模型接入等服务能力,提示系统复用性及扩展性。
2. 知识库检索及管理系统建设
负责知识库入库,向量化检索,召回排序等模块的开发与优化,提升RAG相关任务的响应准确性和稳定性。
3. 本地模型的部署与推理服务搭建
参与本地大模型(如Qwen、BaiChuan、Llama)推理框架部署、接口封装、性能调优等,提升系统自主可控性。
4. 任务流程与工作流编排设计
构建AI任务流程及工作流。确保任务流程和工作流可以作为插件调用。支持多轮对话及条件分支,确保AI项目敏捷性及服务业务弹性需求。
5. 通用平台能力建设
推动文本处理、权限控制、调用日志、用户配置等模块平台化,沉淀通用组件,支撑跨场景能力复用。

任职要求:
1. 本科及以上学历,计算机、软件工程或相关专业,3年以上Node.js / Python后端开发经验;
2. 具有创新精神,熟悉、理解Agentic workflows和AI agent的架构、模式及其区别和合适的应用场景,有意愿深入结合业务流程,实施最佳实践方案;
3. 精通Node.js(Express/NestJS)和Python(FastAPI、Flask)生态,能独立完成高质量API 和微服务开发;
4. 熟悉大模型推理框架(VLLM、SGLANG、系列),具备实际应用开发经验;
5. 掌握FastGPT 或 LangChain 等 RAG 框架,了解知识库、向量数据库和检索增强技术;
6. 具备云端AI平台(SageMaker、Vertex AI 等)上的部署和生命周期管理经验;
7. 了解微服务架构、容器化(Docker/Kubernetes)和性能优化;
8. 有较强的自驱力和沟通协作能力,能在已有中间件架构基础上主导AI 应用开发。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请