职位描述
岗位职责:
1. 负责图像/视频智能算法的研究与开发: 基于深度学习方法,进行目标检测、目标跟踪、属性识别、行为识别等核心算法的设计、实现、优化与迭代,满足实际业务需求;
2. 跟踪前沿技术并推动应用: 密切关注计算机视觉、深度学习、多模态学习等领域的学术研究进展与工业界最佳实践,评估其潜力,并探索在公司现有产品或新场景中的技术应用与落地方案;
3. 探索视觉/多模态大模型应用: 负责研究、适配、微调或优化视觉大模型或图文多模态大模型,探索其在特定场景下的创新应用,提升模型效果与效率;
4. 算法工程化与部署: 负责将研发的算法模型高效地部署到不同计算平台,包括但不限于嵌入式设备、服务器及云平台,优化推理性能和资源消耗。
岗位要求:
1. 学历与专业: 硕士及以上学历,计算机科学、电子工程、自动化、数学、统计学或相关专业背景,图像处理、模式识别、计算机视觉方向优先;
2. 编程基础: 具备扎实的编程能力,精通C/C++,熟练掌握Python;
3. 图像处理基础: 深入理解数字图像处理基础,掌握常用图像特征提取方法和图像处理技术;
4. 机器学习与深度学习: 掌握经典的机器学习算法及其原理。熟练使用主流深度学习框架,具备构建、训练和调试深度学习模型的实际经验;
5. 深度学习模型知识: 具备扎实的深度学习理论基础,熟悉CNN、Transformer等架构,深入了解各类经典模型(如YOLO系列、Faster R-CNN、ResNet、MobileNet、ViT等)的设计思想、优缺点及适用场景;
6. 模型优化技术: 熟悉常见的模型优化技术,包括数据增强(Data Augmentation)、知识蒸馏(Knowledge Distillation)、模型剪枝(Pruning)、量化(Quantization)等,并能应用于实际项目以提升模型效率;
7. 核心素质: 对计算机视觉技术充满热情,具备优秀的逻辑思维能力和创新能力,善于发现并解决复杂问题。具备良好的团队协作精神、沟通能力和主动探索钻研的精神;
8. 落地导向与领域认知: 对将前沿算法转化为实际产品、解决真实世界问题有强烈兴趣和追求,对安防监控相关场景及其技术挑战有基本了解。
加分项:
1. 开源贡献: 活跃于开源社区,在Github上有高质量的个人开源项目,或对主流开源图像/视觉项目有显著贡献,项目获得较高Star数量者更佳;
2. 大模型经验: 熟悉大模型(LLM)技术,具有视觉大模型(如DINOv2, SAM, LLaVA等)或多模态大模型(如Flamingo, BLIP-2, GPT-4V等)的研发、微调、应用或部署落地的实际项目经验;
3. 学术成果: 在计算机视觉、人工智能领域的顶级会议(CVPR, ICCV, ECCV, NeurIPS, ICML, ICLR, IJCAI)或期刊(TPAMI, IJCV)发表过论文;
4. 工程部署经验: 熟悉模型部署工具链及性能优化技巧,有实际嵌入式或边缘计算平台部署经验;
5. 安防场景经验: 具备安防行业(如人脸识别、人车结构化、视频摘要、行为分析、ReID等)相关算法开发或项目落地经验。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕