职位详情
推理引擎研发⼯程师 已下线
3-3.5万
上海智焱先行人工智能科技有限公司
上海
3-5年
硕士
06-18
工作地址

LUMINA星扬西岸中心

职位描述
推理引擎研发⼯程师
岗位画像:
AI专业,AI或计算机教育背景
能够利⽤AI⼯具快速交付成果
思维逻辑强
熟悉LLM、Python、PyTorch、Transformer
⼯作内容:

经验:3年
学历:硕⼠及以上
薪资范围:30k-35k
岗位描述
1. LLM与AIGC 推理引擎的开发与优化
2. LLM与AIGC 推理中间件的开发与优化
3. LLM与AIGC 推理引擎在不同芯⽚上的适配与优化
4. LLM与AIGC 先进推理技术的探索与研究
5. LLM与AIGC 模型适配与优化
岗位要求
1. 硕⼠及以上学历,⼈⼯智能、计算机科学、电⼦信息等相关专业,应届毕业⽣
2. 1-3 年 AI 研发经验。
3. 对⼤模型推理引擎、K8s、容器、⽹络,分布式、GPU架构、云原⽣AI等⽅⾯技术有深⼊研究;
4. 具备扎实的⼯程能⼒,Go、C/C++、Python等开发语⾔,具有丰富的开发、调试和性能优化等经
验;
5. 熟悉 LLM 与 AIGC 推理引擎关键技术、如算⼦优化、模型压缩与量化 、 分布式并⾏推理、推理引
擎运⾏时、模型编译等
6. 熟悉主流深度学习框架(例如PyTorch)、推理引擎框架(vLLM、SGLang),Kubeflow,并对底层实
现有⼀定了解,在模型训练或推理性能优化⽅⾯有实操经验
7. 熟悉 kubernetes⼯作原理,熟悉调度器、资源扩展机制、容器运⾏时、容器⽹络等技术8. 对AI系统的性能分析⼯具、GPU架构、⾼性能⽹络、⾼性能缓存.⼤模型原理等技术有深⼊理解,
有开发和优化经验
9. 熟悉 Transformer / Diffustion / DiT 等模型技术的原理与实现
加分项
1. 有完整的推理系统或推理引擎开发经验者优先
2. 熟悉主流深度学习框架底层原理(如 Transformer 、PyTorch、vLLM、SGLang)者优先
3. 有模型蒸馏、剪枝、量化等模型压缩与部署优化经验者优先
4. 有分布式系统开发、异构计算资源管理与调度经验者优先。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

查看更多相似职位