岗位职责:
 1.负责私有化大模型的部署实施,包括环境准备(如基于KVM 的虚拟化集群、裸金属服务器部署)、模型文件管理(如 Hugging Face / ModelScope模型仓库集成)、推理服务搭建(如 TensorFlow Serving、PyTorch TorchServe);
 2.根据业务需求完成大模型定制化部署(如多模型版本共存、API 网关集成、访问权限控制),保障部署的稳定性与安全性;
 3.运用强化学习(如 PPO、DQN)、迁移学习、LoRA 微调等技术优化模型性能,针对特定场景(如医疗、金融)完成模型适配(如领域知识注入);
 4.监控模型运行状态(如推理延迟、准确率下降),收集训练数据与日志(如 TensorBoard 日志分析),提出模型改进方案(如架构调整、数据增强);
 5.探索新型训练框架与优化方法(如 Deepspeed 混合精度训练、Megatron-LM 分布式训练),提升大规模模型训练效率(如缩短训练周期 30% 以上)。
 任职要求:
 1.本科及以上学历,人工智能、计算机相关专业;
 2.5年以上大模型部署与训练调优经验,熟悉 GPT、LLaMA、BERT 等主流大模型架构;
 3.掌握强化学习基本原理与实践(如 OpenAI Gym 环境、Ray RLlib 框架),具备 RLHF(人类反馈强化学习)优化模型的经验;
 4.熟悉私有化部署技术,了解容器化(Docker/K8s)与云原生部署流程(如 Helm Charts 部署模型服务);
 5.具备 Python 编程能力,熟练使用 PyTorch/TensorFlow 等深度学习框架,了解 CUDA 编程(如自定义 op 优化模型推理);
 6.具有良好的问题解决能力,可独立完成模型部署与调优全流程(如从模型下载到线上服务的完整链条)。