base:杭州或者上海都可以
Python工程师(算法工程化)
岗位职责
模型服务化部署:负责将算法工程师研发的机器学习 / 深度学习模型转化为高效、稳定、可扩展的线上服务(如 RESTful API、gRPC 服务等),确保服务高可用、低延迟。
服务架构设计:设计高并发、高可靠的服务端架构,优化资源利用率,支持模型推理、数据预处理、结果缓存等流程。
性能调优:持续优化服务端性能(如响应时间、吞吐量、资源占用率),提升模型推理效率,降低服务成本。
系统维护与监控:搭建服务监控体系(日志、指标、告警),保障线上服务稳定性;快速定位并解决服务异常、性能瓶颈等问题。
协作对接:与算法工程师、客户端开发、运维团队紧密配合,确保模型迭代与业务需求无缝衔接。
岗位要求
硬性条件
经验:3 年以上服务端开发经验,有机器学习模型部署经验者优先(TensorFlow Serving、TorchServe、Triton 等框架)。
技术栈:
精通 Python/Go/Java 至少一种语言,熟悉 Flask/Django/Gin/Spring 等框架;
熟悉分布式系统、微服务架构(如 gRPC、Kafka、Redis)、容器化技术(Docker/K8s);
掌握模型部署工具链(ONNX、TensorRT、模型量化 / 压缩等)。
云平台:熟悉 AWS、阿里云等云服务,具备服务高可用设计、弹性扩缩容经验。
加分项
熟悉模型推理性能优化(GPU/CPU 资源调度、并行计算、显存管理);
了解 CI/CD、自动化测试流程(Jenkins/GitLab CI);
有大规模数据处理(Spark/Flink)或实时服务开发经验。