岗位职责:
基于FastAPI构建高性能生物大模型服务中台,深度集成ToolUniverse工具生态,实现AlphaFold/ESM等生物模型的生产级Docker封装、分布式调度与全链路服务治理。
任职要求:
1、FastAPI实战经验:2年+ 生产级FastAPI服务开发(需提供GitHub项目或PR证明)
2、大模型部署:熟悉vLLM/TensorRT-LLM/Triton至少一种,解决过GPU OOM、推理延迟高等问题
3、Docker深度用户:能独立优化镜像体积,熟悉docker buildx多架构构建
4、Kubernetes进阶:编写过Operator/CRD,理解Informer机制与控制器模式