职位描述
岗位职责:
1. 负责 NLP、CV、语音等多种模型的推理服务化开发,服务部署,异构算力适配等工作;
2. 负责模型推理在多个 AI 产品中落地,在项目中私有化部署;
3. 参与模型开发平台的设计与开发,保障平台的性能和稳定性。
岗位要求:
1. 本科及以上学历,计算机或人工智能相关专业优先;
2. 熟练掌握 Golang,编程功底扎实,有实际项目的研发和落地经验;
3. 熟悉Docker、Kubernetes等云原生技术,能基于 Kubernetes 完成服务的部署运维;
4. 熟悉模型推理相关研发,能够独立完成模型服务的部署;
5. 加分项:熟练掌握Python; 熟悉 vLLM、Triton、PyTorch 框架;有异构算力适配经验。"
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕