岗位职责:
1、负责设计、开发、优化和部署基于 YOLO 系列模型的核心算法及应用。
2、实现复杂场景下的物体动态识别功能,重点聚焦于动物运动活跃度分析、表情识别等高级视觉任务。
任职要求:
1、精通计算机视觉基础理论,包括但不限于:图像处理、特征提取、目标检测、目标跟踪(MOT)、行为识别、姿态估计、表情识别等。
2、深入理解深度学习原理,特别是卷积神经网络(CNN)、Transformer 等主流架构。
3、熟练掌握 YOLO (v3, v4, v5, v7, v8, v9 等) 系列模型的架构、原理、训练技巧及优化方法。
4、拥有使用 YOLO 模型进行**目标检测与跟踪**的实际项目经验,能够独立完成从数据准备、模型训练、调优到部署的全流程。
5、精通基于视频流的多目标跟踪 (MOT)技术(如 DeepSORT, ByteTrack, BoT-SORT 等),并能将其与 YOLO 检测器有效结合,实现物体(特别是动物)的持续、稳定跟踪。
6、具备从跟踪轨迹中提取和分析运动特征(速度、加速度、运动方向、活动范围、运动模式)的能力,定义和量化“活跃度”指标。
7、熟悉面部检测与关键点定位技术(如 MediaPipe, Dlib, 或基于 CNN 的方法),并具备将表情识别模型(FER, AffectNet 等数据集常用模型)或算法集成到 YOLO 流程中,或利用 YOLO 检测动物面部后再进行表情分析的经验。对动物面部结构和表情特征有了解者优先。
8、掌握 YOLO 模型在不同平台(服务器、边缘设备如 Jetson, Raspberry Pi)上的**部署和优化**技巧(TensorRT, ONNX, OpenVINO, NCNN, TFLite 等)。
9、具备处理大规模图像/视频数据集的经验,包括数据采集、清洗、标注(熟悉常用标注工具)、增强(特别是针对动态场景和动物数据)和管理。
10、精通模型训练技巧:超参数调优、损失函数设计、防止过拟合(正则化、Dropout)、学习率策略等。
11、掌握模型压缩、量化、剪枝等模型优化技术,以提升在资源受限设备上的性能。
12、精通 Python 编程语言。
13、熟练掌握深度学习框架:PyTorch(必需),熟悉 TensorFlow/Keras 者加分。
14、熟练使用 OpenCV 等计算机视觉库。
15、熟悉 Linux 开发环境。
16、具备良好的代码规范、版本控制(Git)和工程化能力。