阿里云招聘(地点:北上广深&成都&西安),有意详聊。
1. 基于 vLLM、SGLang 等主流推理引擎,设计并部署高效、稳定的大模型推理服务;
2. 构建和优化基于 RAG、Prompt Engineering、插件及 Agent 的大模型应用系统;
3. 编写 Python/Shell 自动化脚本,实现模型部署、监控与持续集成;
4. 与客户紧密协作,理解业务需求,提供端到端的技术方案并推动落地;
5. 支持客户在云平台(如 PAI)上进行性能验证与调优,确保系统满足生产级要求。
职位要求
1. 计算机通信或相关专业985/211院校 本科及以上学历;
2. 了解PyTorch或TensorFlow等机器学习框架,了解张量、梯度等的基本数据结构和前后向传播原理;
3. 了解大模型推理框架vLLM、SGLang等业界主流推理引擎。
4. 具备3年及以上大模型相关工作经验
5. 熟悉大模型Prompts、RAG、插件、Agent等的使用环境和开发方法,具备通过代码实现大模型应用开发的经验;
6. 熟练使用Python/shell等编写自动化部署脚本;
7. 精通至少一种编程语言(如Python,Java);
8. 有良好的沟通和协调能力,丰富的技术服务工作经验,可接受短期出差。