职位描述
1.负责将AI算法模型,通过工程化手段高效部署到多种硬件平台。主导模型的格式转换、量化与优化,熟练使用ONNX、TensorRT等工具链,实现模型从PyTorch/TensorFlow到嵌入式平台(如Jetson、RK系列)或NPU(如高通/MTK系列)的高效迁移。
2.设计混合量化策略(INT8/INT4/FP16),针对敏感层定制量化方案,将精度损失控制在1%以内,同时优化推理速度与内存占用。
3.开发基于C++/Python的高性能推理引擎,集成多线程、内存池等技术,提升端到端吞吐率与实时性。
4.构建定制化Linux系统:完成内核裁剪、驱动开发(如摄像头、NPU加速器)、文件系统定制,并优化启动时间与资源调度。
5.深入Linux内核机制,针对进程管理、内存分配等模块进行调优,确保算法在资源受限环境下的稳定性(如实时性任务处理)
6.熟悉硬件接口协议(UART、I2C、SPI、CAN),协同硬件团队完成板级开发与调试。
7.编写技术文档(如量化白皮书、部署手册),并支持算法团队理解硬件约束,推动算法设计阶段的工程化适配。
任职要求
1.本科及以上学历,计算机、电子工程、自动化等相关专业。
2.3年以上算法工程化或嵌入式AI部署经验,有大型项目落地案例(如智能驾驶、机器人、物联网设备)。
3.有多年ONNX Runtime/TensorRT量化实战经验。
4.熟悉NPU架构,具备针对芯片特性的量化方案定制能力。
5.精通嵌入式Linux开发全流程,包括内核配置、驱动开发、根文件系统构建。
6.熟练使用C++/Python,掌握Shell/CMake脚本编写,具备多进程/协程编程与性能剖析能力。
7.有高并发、低延迟系统设计经验,熟悉分布式架构与缓存机制。
8.强烈的工程落地导向,能平衡算法精度与部署效率的矛盾。
9.具备良好的问题解决能力和团队合作精神,能够承受工作压力。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕