8000-10000元
企业壹号公园-20号楼
1.基于 FastAPI 框架搭建AI 智能体平台微服务,负责接口设计开发,保障服务高并发稳定运行。
2.负责LLM统一接入及LLM 定制化调优、性能迭代。
3.设计并开发智能体核心功能,实现复杂智能体工作流,并集成到 FastAPI 微服务体系中。
4.进行微服务开发与调试,完成接口设计、单元测试、集成测试,快速定位并解决性能瓶颈、接口异常、依赖冲突等问题;开展服务监控与链路追踪相关工作。
5.负责AI微服务 Docker/K8s容器化打包、部署;搭建生产环境部署流程,支持灰度发布、回滚操作与问题快速排查。
6.将调优后的 LLM 模型封装为 Python 服务,实现在线推理与批量推理功能;负责生产环境服务上线、灰度发布、回滚操作,保障服务稳定性与可用性;熟悉日志收集与分析,快速排查生产环境问题。
7.与产品经理、前端工程师、测试工程师等团队成员协作,完成平台开发任务;分享技术经验,推动团队技术提升。
学历及项目经验要求
1.985 本科或研究生学历,计算机科学与技术、软件工程、人工智能等相关专业优先;在FastAPI微服务开发、LLM 模型调优、AI智能体平台搭建等领域有突出实践成果者,学历要求可适当放宽。
2.具备扎实的数学基础,能够熟练运用数学方法解决 LLM 模型调优、智能体决策逻辑设计等实际算法问题。
3.具有至少3年FastAPI 微服务开发、AI 智能体平台构建、LLM 接入与调优相关工作经验,或在研究生阶段参与过同类科研项目;有在互联网、科技类企业主导/参与 AI 智能体开发平台类项目落地经验者优先。
4.在过往项目中,能够独立负责基于 FastAPI 搭建高可用微服务、LLM 接入、模型微调/性能优化、 Docker 容器化部署等工作。
5.能够独立设计服务拆分、接口规范、数据流转方案;熟悉 LLM 生态对接流程,有对接 GPT、Claude、文心一言、通义千问等各类闭源/开源 LLM 的实际项目经验。
技术能力要求
1.精通 Python 开发语言及开发环境,深度掌握FastAPI 框架,能够独立搭建Python微服务架构,熟练掌握Transformers、Moe等大模型开发框架,并掌握Resful接口、rag知识库、缓存服务等技术;
2.熟悉 Java、C++ 至少一种其他编程语言,具备一定的 Shell、SQL 脚本能力,用于服务自动化部署、数据查询与批量处理。
3.深入理解 Transformer 架构及 LLM 基本原理,熟练掌握LLM 模型调优技术:包括 Prompt 工程、SFT、RLHF、LoRA/QLoRA 轻量化微调等,能够根据业务需求对开源 LLM进行定制化调优与性能优化。
4.熟悉 AI 智能体核心技术,了解智能体的规划、记忆、工具调用等核心模块设计,能够基于 LangChain 等框架构建复杂智能体流程,并集成到 FastAPI 微服务中。
5.熟悉模型压缩与加速技术:包括模型剪枝、量化(INT8/INT4)、TensorRT/ONNX Runtime 推理加速等,能够优化 LLM 在生产环境中的推理速度与资源占用。
5.熟练掌握Docker 容器化技术,能够编写 Dockerfile、Docker Compose 配置文件,实现 AI 微服务的打包、镜像管理与批量部署;熟悉 K8s,能够在 k8s 集群中进行服务编排、扩缩容与监控。
7.熟练进行微服务开发与调试:能够独立完成接口设计、单元测试、集成测试,快速定位并解决服务运行中的性能瓶颈、接口异常、依赖冲突等问题;具备服务监控与链路追踪经验。
综合素质要求
1.对 AI 领域新技术、新框架等有强烈的好奇心和学习欲望,能够快速掌握并落地到实际项目中。
2.具备在 AI 智能体平台架构设计、LLM 调优方案、微服务性能优化等方面提出新思路,优化现有平台架构与模型解决方案,提升产品竞争力。
3.具备对复杂的 AI 平台开发需求进行拆解分析,提出可行的技术方案,并组织资源推进实施与验证;能够应对高并发、高可用等技术挑战能力。
4.能够与产品经理、前端工程师、测试工程师等团队成员高效沟通协作,共同完成平台开发任务;具备良好的团队合作精神,能够分享技术经验,推动团队技术提升。
5.具备良好的口头和书面沟通能力,能够清晰准确地表达技术方案、接口文档与项目进展,能够与内部团队及外部合作方进行有效的技术交流。
6.能够在高强度的项目开发环境下保持良好工作状态,应对需求变更、技术难题等各类挑战,按时保质完成工作任务。
加分项
1.发表过与 AI 算法相关的学术论文,或参加过国内外知名的 AI 竞赛并取得优秀成绩。
2.有独立主导/核心参与AI智能体开发平台、LLM 服务平台等项目从 0 到 1 落地的经验。
3.在 GitHub 等平台有开源的 FastAPI 微服务项目、LLM 调优工具或 AI 智能体相关项目,或为FastAPI、LangChain等知名开源项目贡献过代码。
4.熟悉阿里云、华为云等云计算平台,能够在云端进行 LLM 模型训练、微服务部署与弹性扩缩容;熟悉Docker、K8S云原生相关技术。
5.熟悉 MLOps 流程,能够搭建模型训练、部署、监控的全流程自动化体系。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕