「北京海淀区 AI部署优化工程师招聘」_2026年分音塔科技招聘-智联招聘

职位详情

AI部署优化工程师

1.5-2.5万

分音塔科技

北京

不限

本科

01-13

工作地址

锦秋国际大厦A801

职位描述

1.负责将AI算法模型，通过工程化手段高效部署到多种硬件平台。主导模型的格式转换、量化与优化，熟练使用ONNX、TensorRT等工具链，实现模型从PyTorch/TensorFlow到嵌入式平台（如Jetson、RK系列）或NPU（如高通/MTK系列）的高效迁移。
2.设计混合量化策略（INT8/INT4/FP16），针对敏感层定制量化方案，将精度损失控制在1%以内，同时优化推理速度与内存占用。
3.开发基于C++/Python的高性能推理引擎，集成多线程、内存池等技术，提升端到端吞吐率与实时性。
4.构建定制化Linux系统：完成内核裁剪、驱动开发（如摄像头、NPU加速器）、文件系统定制，并优化启动时间与资源调度。
5.深入Linux内核机制，针对进程管理、内存分配等模块进行调优，确保算法在资源受限环境下的稳定性（如实时性任务处理）
6.熟悉硬件接口协议（UART、I2C、SPI、CAN），协同硬件团队完成板级开发与调试。
7.编写技术文档（如量化白皮书、部署手册），并支持算法团队理解硬件约束，推动算法设计阶段的工程化适配。
任职要求
1.本科及以上学历，计算机、电子工程、自动化等相关专业。
2.3年以上算法工程化或嵌入式AI部署经验，有大型项目落地案例（如智能驾驶、机器人、物联网设备）。
3.有多年ONNX Runtime/TensorRT量化实战经验。
4.熟悉NPU架构，具备针对芯片特性的量化方案定制能力。
5.精通嵌入式Linux开发全流程，包括内核配置、驱动开发、根文件系统构建。
6.熟练使用C++/Python，掌握Shell/CMake脚本编写，具备多进程/协程编程与性能剖析能力。
7.有高并发、低延迟系统设计经验，熟悉分布式架构与缓存机制。
8.强烈的工程落地导向，能平衡算法精度与部署效率的矛盾。
9.具备良好的问题解决能力和团队合作精神，能够承受工作压力。

以担保或任何理由索取财物，扣押证照，均涉嫌违法，请提高警惕