推理引擎研发⼯程师
•
岗位画像:
◦
AI专业,AI或计算机教育背景
◦
能够利⽤AI⼯具快速交付成果
◦
思维逻辑强
◦
熟悉LLM、Python、PyTorch、Transformer
•
⼯作内容:
◦
•
经验:3年
•
学历:硕⼠及以上
•
薪资范围:30k-35k
岗位描述
1. LLM与AIGC 推理引擎的开发与优化
2. LLM与AIGC 推理中间件的开发与优化
3. LLM与AIGC 推理引擎在不同芯⽚上的适配与优化
4. LLM与AIGC 先进推理技术的探索与研究
5. LLM与AIGC 模型适配与优化
岗位要求
1. 硕⼠及以上学历,⼈⼯智能、计算机科学、电⼦信息等相关专业,应届毕业⽣
2. 1-3 年 AI 研发经验。
3. 对⼤模型推理引擎、K8s、容器、⽹络,分布式、GPU架构、云原⽣AI等⽅⾯技术有深⼊研究;
4. 具备扎实的⼯程能⼒,Go、C/C++、Python等开发语⾔,具有丰富的开发、调试和性能优化等经
验;
5. 熟悉 LLM 与 AIGC 推理引擎关键技术、如算⼦优化、模型压缩与量化 、 分布式并⾏推理、推理引
擎运⾏时、模型编译等
6. 熟悉主流深度学习框架(例如PyTorch)、推理引擎框架(vLLM、SGLang),Kubeflow,并对底层实
现有⼀定了解,在模型训练或推理性能优化⽅⾯有实操经验
7. 熟悉 kubernetes⼯作原理,熟悉调度器、资源扩展机制、容器运⾏时、容器⽹络等技术8. 对AI系统的性能分析⼯具、GPU架构、⾼性能⽹络、⾼性能缓存.⼤模型原理等技术有深⼊理解,
有开发和优化经验
9. 熟悉 Transformer / Diffustion / DiT 等模型技术的原理与实现
加分项
1. 有完整的推理系统或推理引擎开发经验者优先
2. 熟悉主流深度学习框架底层原理(如 Transformer 、PyTorch、vLLM、SGLang)者优先
3. 有模型蒸馏、剪枝、量化等模型压缩与部署优化经验者优先
4. 有分布式系统开发、异构计算资源管理与调度经验者优先。