职位详情
算法模型开发工程师
1.6-3万
河南东微电子材料有限公司
上海
1-3年
本科
09-11
工作地址

颛桥科技绿洲40号楼颛桥科技绿洲40号楼一二层

职位描述
工作内容:
1.负责大语言模型 / 生成模型在 AI 加速卡(GPU/NPU/自研卡) 上的移植与性能优化,按需动态优化;
2.编写与维护推理 Demo(文本生成、图像生成、语音合成等),形成可复用范式与最佳实践;
3.研究与落地 量化(FP16/BF16/INT8/INT4)与推理加速方案(算子融合、图优化、编译优化);
4.优化 算子实现、内存访问策略、并行调度与流水线,系统性提升吞吐与时延表现;
5.搭建与维护推理与性能评测环境,建立 Profiling/Benchmark 体系并持续回归;
6.快速定位瓶颈与问题,协同编译器、驱动、框架与模型团队修复并沉淀技术文档/报告。
任职要求:
一、教育背景
1.本科及以上学历,计算机科学、电子工程、自动化、软件工程等相关专业毕业。
二、专业技能
1.熟悉 PyTorch / TensorFlow 等深度学习框架,精通 Python/C++,具备良好的编码与调试习惯;
2.了解主流大模型(如 LLaMA、Qwen、ChatGLM、Stable Diffusion 等)的推理流程与部署要点,有使用或二次开发经验;
3.掌握张量计算与并行编程基础,理解 内存层次结构、带宽/算力均衡、批量与并行策略 等性能优化思路;
4.了解 量化/蒸馏/剪枝 等推理压缩技术,能结合硬件特性选择并实现合适方案;
5.熟悉 Linux 环境下的开发与调试,能独立完成环境搭建、依赖管理与性能测试。
三、工作经验
1.1–3 年相关经验优先;有 GPU/NPU/AI 加速卡 上模型适配或性能优化实践者优先;
2.有端到端推理项目落地经验(模型→算子→编译/部署→监测与回归)更佳。
四、能力素质
1.具备扎实的逻辑思维与问题分析能力,能在复杂系统中快速定位并解决性能/稳定性问题;
2.良好的跨团队沟通与协作能力,能与硬件、编译器、框架、应用等多方高效配合;
3.结果导向与自驱力强,注重细节与质量,能在压力下按期交付高质量成果。
欢迎符合条件者加入,共推 NPU 产品高质量发展,待遇优厚!

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请