岗位职责:
1.专注于图像识别和自然语言处理(NLP)的端侧模型,负责开发、优化和部署轻量级AI模型到移动端(Android/iOS)或嵌入式设备(如IoT设备),将参与从算法选型到落地部署的全流程,推动AI技术在端侧的高效应用。
2.开发与优化轻量级图像识别(如目标检测、分类)和NLP(如文本分类、语音识别)模型,确保其在端侧设备的高效运行。
3.使用模型压缩技术(如量化、剪枝、知识蒸馏)和硬件加速(NPU/GPU/DSP)提升模型性能。
4.实现端侧模型的跨平台部署(TensorFlow Lite、Core ML、ONNX Runtime等)。
5.与算法团队协作,针对端侧场景定制模型架构(如MobileNet、EfficientNet、BERT-Tiny等)。
6.监控端侧模型的实时性能(延迟、内存、功耗),持续优化用户体验。
7.跟踪前沿技术(如Transformer轻量化、多模态模型端侧部署),推动技术落地。
任职要求:
1、学历:本科及以上学历
2、专业:计算机科学、电子工程、数学等相关专业
3、工作经验:
4、能力要求:
(1)熟练掌握Python/C++,熟悉主流深度学习框架(PyTorch/TensorFlow)。
(2)熟悉端侧部署工具链(NCNN、MNN、ONNX、TFLite、ML Kit、Qualcomm SNPE等)。
(3)精通模型压缩技术(量化、剪枝)和端侧性能调优(ARM架构经验加分)。
(4)在图像识别(CV)或NLP领域有实际项目经验(如食材识别、OCR、语音助手等)。
(5)了解端侧开发(Android NDK/iOS Core ML或嵌入式Linux)
5、加分项:
(1)有MCU(如STM32)或边缘设备(Jetson、树莓派)部署经验。
(2)熟悉异构计算(OpenCL/Vulkan)或编译器优化(TVM/MLIR)。
(3)发表过相关论文或开源项目贡献者优先。