职位描述
岗位职责:
1、参与算法服务系统的架构设计与开发,负责算法模型的服务化部署与性能优化;
2、使用 FastAPI 构建高性能、可扩展的异步后端服务,支撑大规模模型在线调用;
3、实现与数据平台、模型训练平台的对接,打通训练-评估-上线全流程;
4、设计高效的异步任务调度机制,支持批量推理、流式输出、在线 A/B 实验等场景;
5、与算法工程师协作,实现模型推理逻辑的接口封装与业务对接;
6、持续提升算法系统的可维护性、稳定性与监控能力;
7、编写高质量代码与技术文档,参与技术选型与架构优化。
任职要求:
1、熟练掌握 Python,具备扎实的编程功底,熟悉异步编程(asyncio);
至少 1 年以上使用 FastAPI / Starlette / Sanic 等异步框架开发经验,具备生产级部署经验;
2、熟悉现代后端系统设计,具备良好的 API 设计能力与系统性能优化意识;
3、熟悉常见模型服务部署方式,如 RESTful、WebSocket、gRPC 等;
4、熟悉 Docker、Linux、Nginx,具备基础的 DevOps 能力;
5、有算法模型部署经验(如 NLP、CV、推荐系统等)优先;
6、有微服务、分布式系统经验优先;
良好的团队协作与沟通能力,具备自驱力与责任感。
加分项:
1、熟悉模型压缩、ONNX/TensorRT 推理加速;
2、熟悉 Kafka、Redis、RabbitMQ 等中间件;
3、熟悉 Prometheus + Grafana、OpenTelemetry 等监控体系;
4、有大型模型(如大语言模型 LLM)在线推理系统经验。
我们提供:
1、有竞争力的薪资 ;
2、技术导向的团队氛围,灵活高效的开发流程;
3、深度参与核心算法产品构建的机会;
4、开放的学习环境和技术成长空间。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕