岗位职责:
1.模型训练与微调落地:负责 CV/NLP/ 多模态等 AI 模型(边缘/端侧)的训练、微调与迭代优化,针对广告显示、教育、工业、安防监控等边缘场景需求,定制模型效果优化方案,保障模型精度与业务指标达标。
2.推理全流程优化:基于RK3588或同类边缘芯片的 NPU 算力特性,设计模型轻量化与推理适配方案,通过量化、剪枝、稀疏化等技术实现模型压缩,提升推理性能。
3.软硬件协同优化:深入理解边缘AI芯片架构与 NPU 特性,协同底层 runtime 与算子库团队,解决模型部署中的内存管理、数据传输等系统级问题。
4.推理服务构建与运维:基于 TensorRT、vLLM 、ONNX等工具搭建平台推理服务,通过容器化部署实现弹性伸缩,并构建性能监控体系保障服务稳定性。
5.技术积累与创新:跟踪边缘 AI 领域前沿技术,积累模型优化方法与部署工具链,主导技术文档撰写与跨团队技术分享。
任职要求:
1.学历与专业:计算机、电子工程、数学等相关专业一本以上学历,有 AI 模型训练、部署与推理优化经验。
2.核心技术能力:
①精通 PyTorch/TensorFlow 框架,具备分布式训练、混合精度训练实践经验,熟悉 Hugging Face Transformers 等代码库;
②深入掌握模型量化、剪枝、蒸馏等轻量化技术,有 RK3588/NPU 平台优化经验者优先,能独立完成模型从训练到推理的全流程适配;
③熟练掌握 C/C++/Python/CUDA 编程,了解计算机体系结构与高性能计算原理,具备算子优化能力者加分;
④熟悉 Linux 操作系统,了解 K8s 容器化部署与 Prometheus 监控工具,具备推理服务运维经验者优先。
3.项目经验:
①有边缘计算场景(智能硬件、商业广告、工业检测、安防监控等)AI 模型落地项目经验;
②基于AI边缘芯片的模型部署与性能优化,能提供具体性能指标(如推理延迟、算力利用率)者优先。
4.综合素质:具备较强的问题定位能力与团队协作能力,对边缘 AI 技术有热情,能快速跟进业界新技术动态。