职位描述
任职要求:
1.计算机相关专业本科及以上学历,具备扎实的计算机基础,熟悉 Linux 系统操作、网络基础及常见服务器运行环境;
2.精通 Python 后端开发,具备扎实的工程能力,熟练掌握 FastAPI 等主流 Python Web 框架,能够独立完成 Python 后端服务的设计、开发与维护;
3.具备良好的接口设计能力,熟悉 RESTful API 设计规范,能够完成推理服务接口、参数校验、异常处理与返回结构规范化;
4.熟悉深度学习模型推理流程,了解 PyTorch、ONNX 等模型格式,具备模型部署、加载与推理服务化经验;
5.熟悉 NVIDIA GPU 运行环境,了解 CUDA、显卡驱动、显存管理等基础概念,具备 GPU 推理调优或多卡使用经验者优先,具备国产算力平台适配经验者优先;
6.了解常见推理框架与运行时(如 ONNX Runtime、TensorRT 等),能够完成模型转换、推理验证及基础性能优化;
7.具备较强的数据处理与工程实现能力,熟练使用 NumPy、OpenCV 等工具完成图像 / 视频数据的预处理、后处理与业务逻辑封装;
8.了解 Docker 等容器化技术,具备基础的服务部署与环境封装能力即可
9.具备良好的代码规范意识、文档习惯和团队协作能力,能够独立定位并解决开发与运行中的问题。
· 岗位职责:
1.负责 AI 模型推理服务的 Python 后端开发工作,基于 FastAPI 等框架构建稳定、可扩展的模型推理接口与业务服务;
2.独立完成推理服务的接口设计、业务逻辑实现、参数校验、异常处理与接口文档编写;
3.负责深度学习模型的服务化落地,包括模型加载、推理流程封装、输入输出规范定义与接口集成;
4.根据不同业务场景,完成模型格式转换、推理框架适配及必要的性能优化(如 ONNX Runtime、TensorRT 等);
5.参与 NVIDIA GPU 推理环境的使用与优化,支持单卡 / 多卡推理及运行稳定性保障;
6.配合前端、业务系统及平台侧完成算法服务对接与系统联调,保障推理服务在实际业务中的可用性;
7.参与推理服务运行过程中的问题排查与持续优化,提升系统稳定性、响应性能与工程可靠性;
8.参与推理服务相关技术文档、接口说明与部署文档的编写,支撑项目交付与平台化演进。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕