人工智能之目标检测系列综述

狂奔的CD 狂奔的CD     2023-01-18     193

关键词:

前言

参考 https://blog.csdn.net/jiaoyangwm/article/details/89111539

时间线

慢慢补充

正文

1.传统目标检测

在深度学习出现之前,传统的目标检测方法大概分为区域选择(滑窗)、特征提取(SIFT、HOG等)、**分类器(SVM、Adaboost等)**三个部分,其主要问题有两方面:一方面滑窗选择策略没有针对性、时间复杂度高,窗口冗余;另一方面手工设计的特征鲁棒性较差。
参考 https://blog.csdn.net/eternity1118_/article/details/88894617

2.目标检测-神经网络

参考:https://blog.csdn.net/electech6/article/details/95240278

概要记录:
改文章主要描述的是基于神经网络的目标检测模型
一类是基于Region Proposal的R-CNN系算法(R-CNN,Fast R-CNN, Faster R-CNN等),它们是two-stage的,需要先算法产生目标候选框,也就是目标位置,然后再对候选框做分类与回归。而另一类是Yolo,SSD这类one-stage算法,其仅仅使用一个卷积神经网络CNN直接预测不同目标的类别与位置。第一类方法是准确度高一些,但是速度慢,但是第二类算法是速度快,但是准确性要低一些。这可以在下图中看到。

2-1. R-CNN

【算法流程】

  1. 输入一张图片,通过指定算法从图片中提取 2000 个类别独立的候选区域(可能目标区域)
  2. 对于每个候选区域利用卷积神经网络来获取一个特征向量
  3. 对于每个区域相应的特征向量,利用支持向量机SVM 进行分类,并通过一个bounding box regression调整目标包围框的大小

【贡献】
在2014年R-CNN横空出世的时候,颠覆了以往的目标检测方案,精度大大提升。对于R-CNN的贡献,可以主要分为两个方面:

  1. 使用了卷积神经网络进行特征提取
  2. 使用bounding box regression进行目标包围框的修正

【缺陷】

  1. 耗时的selective search,对一张图像,需要花费2s
  2. 耗时的串行式CNN前向传播,对于每一个候选框,都需经过一个AlexNet提取特征,为所有的候选框提取特征大约花费47s
  3. 三个模块(CNN特征提取、SVM分类和边框修正)是分别训练的,并且在训练的时候,对于存储空间的消耗很大

2-2. Fast R-CNN

【算法流程】

  1. 首先还是采用selective search提取2000个候选框RoI
  2. 使用一个卷积神经网络对全图进行特征提取
  3. 使用一个RoI Pooling Layer在全图特征上摘取每一个RoI对应的特征
  4. 分别经过为21和84维的全连接层(并列的,前者是分类输出,后者是回归输出)

【贡献】
Fast R-CNN的贡献可以主要分为两个方面:

  1. 取代R-CNN的串行特征提取方式,直接采用一个CNN对全图提取特征(这也是为什么需要RoI Pooling的原因)。
  2. 除了selective search,其他部分都可以合在一起训练。

Fast R-CNN通过CNN直接获取整张图像的特征图,再使用RoI Pooling Layer在特征图上获取对应每个候选框的特征,避免了R-CNN中的对每个候选框串行进行卷积(耗时较长)

【缺陷】
Fast R-CNN也有缺点,体现在耗时的selective search还是依旧存在。

2-3. Faster R-CNN

【算法流程】
Faster R-CNN由共享卷积层、RPN、RoI pooling以及分类和回归四部分组成:

  1. 首先使用共享卷积层为全图提取特征feature maps
  2. 将得到的feature maps送入RPN,RPN生成待检测框(指定RoI的位置),并对RoI的包围框进行第一次修正
  3. RoI Pooling Layer根据RPN的输出在feature map上面选取每个RoI对应的特征,并将维度置为定值
  4. 使用全连接层(FC Layer)对框进行分类,并且进行目标包围框的第二次修正。

尤其注意的是,Faster R-CNN真正实现了端到端的训练(end-to-end training)。Faster R-CNN最大特色是使用了RPN取代了SS算法来获取RoI。

2-4.Mask R-CNN

【算法流程】
Mask R-CNN可以分解为如下的3个模块:Faster-RCNN、RoI Align和Mask。

2-5.Yolo

Yolo创造性的提出了one-stage,也就是将物体分类和物体定位在一个步骤中完成。Yolo直接在输出层回归bounding box的位置和bounding box所属类别,从而实现one-stage。通过这种方式,Yolo可实现45帧每秒的运算速度

【算法流程】
主要分为三个部分:卷积层,目标检测层,NMS筛选层

【缺陷】
Yolo算法开创了one-stage检测的先河,它将物体分类和物体检测网络合二为一,都在全连接层完成。故它大大降低了目标检测的耗时,提高了实时性。但它的缺点也十分明显

  1. 每个网格只对应两个bounding box,当物体的长宽比不常见(也就是训练数据集覆盖不到时),效果很差。
  2. 原始图片只划分为7x7的网格,当两个物体靠的很近时,效果很差
  3. 最终每个网格只对应一个类别,容易出现漏检(物体没有被识别到)。
  4. 对于图片中比较小的物体,效果很差。这其实是所有目标检测算法的通病,SSD对它有些优化,我们后面再看。

2-6.SSD

Faster R-CNN准确率mAP较高,漏检率recall较低,但速度较慢。而Yolo则相反,速度快,但准确率和漏检率不尽人意。SSD综合了他们的优缺点,对输入300x300的图像,在voc2007数据集上test,能够达到58 帧每秒( Titan X 的 GPU ),72.1%的mAP。

【算法流程】
和Yolo一样,也分为三部分:卷积层,目标检测层和NMS筛选层。SSD和Yolo一样都是采用一个CNN网络来进行检测,但是却采用了多尺度的特征图。

ps:从以上了解来看,对于微小目标检测,面临两个问题,
一是,神经网络卷积过程中的下采样,会不断忽略细节,微小物体比如10x10这样的size,使用多层卷积可能出现检测不了的情况。
二是,准确率相较大目标,会低很多

ai佳作解读系列-目标检测二十年技术综述

计算机视觉中的目标检测,因其在真实世界的大量应用需求,比如自动驾驶、视频监控、机器人视觉等,而被研究学者广泛关注。 上周四,arXiv新出一篇目标检测文献《ObjectDetectionin20Years:ASurvey》,其对该领域20年来出现的技... 查看详情

[转]目标检测入门之综述(上)

导言:目标检测的任务表述 如何从图像中解析出可供计算机理解的信息,是机器视觉的中心问题。深度学习模型由于其强大的表示能力,加之数据量的积累和计算力的进步,成为机器视觉的热点研究方向。 那么,如何理... 查看详情

26页综述,99篇参考文献!自动驾驶的3d目标检测技术!中国人民大学出品!

...链接:https://arxiv.org/abs/2106.10823这是2021年6月最新的3D目标检测综述,很有参考意义!大家对自动驾驶以及3D目标检测越来越关注:传感器的优缺点:3D目标检测流程这个表很重要往期推荐阅读:王博Kings࿱... 查看详情

计算机视觉系列最新论文(附简介)

计算机视觉系列最新论文(附简介)目标检测1. 综述:深度域适应目标检测标题:DeepDomainAdaptiveObjectDetection:aSurvey作者:WanyiLi,PengWang链接:https://arxiv.org/abs/2002.06797本文共梳理了40篇相关文献,由中科院自动化所学者发布。基... 查看详情

目标检测算法综述

1.传统的目标检测框架,主要包括三个步骤:(1)利用不同尺寸的滑动窗口框住图中的某一部分作为候选区域;(2)提取候选区域相关的视觉特征。比如人脸检测常用的Harr特征;行人检测和普通目标检测常用的HOG特征等;(3)... 查看详情

目标检测综述

...号处理的作业,在这里分享一下,将介绍计算机视觉中的目标检测任务,论述自深度学习以来目标检测的常见方法,着重讲yolo算法,并且将yolo算法与其他的one-stage以及two-stage方法进行比较。目录1.介绍2.YOLO2.1YOLOv12.2YOLOv22.3YOLOv33.... 查看详情

基于深度学习的目标检测算法综述

基于深度学习的目标检测算法综述(一)基于深度学习的目标检测算法综述(二)基于深度学习的目标检测算法综述(三)本文内容原创,作者:美图云视觉技术部检测团队,转载请注明出处目... 查看详情

26页综述,99篇参考文献!自动驾驶的3d目标检测技术!中国人民大学出品!

...链接:https://arxiv.org/abs/2106.10823这是2021年6月最新的3D目标检测综述,很有参考意义!大家对自动驾驶以及3D目标检测越来越关注:传感器的优缺点:3D目标检测流程这个表很重要往期推荐阅读:王博Kings࿱... 查看详情

目标检测领域中的数据不均衡问题综述

作者:TomHardyDate:2020-05-16来源:目标检测领域中的数据不均衡问题综述参考:ImbalanceProblemsinObjectDetectionpaper链接:https://arxiv.org/abs/1909.00169.pdf主要内容和相关背景本文主要介绍了目标检测领域的八个数据不平衡问题,并将这些问... 查看详情

目标检测系列——开山之作rcnn原理详解

...icgo+typora实现步骤及无法上传图片解决方案🍊近期目标:拥有10000粉丝🍊支持小苏:点赞👍🏼、 查看详情

史上最全综述|3d目标检测算法汇总!(单目/双目/lidar/多模态/时序/半弱自监督)

史上最全综述|3D目标检测算法汇总!(单目/双目/LiDAR/多模态/时序/半弱自监督)2022-09-0209:06计算机视觉life”,选择“星标”快速获得最新干货本文转载自自动驾驶之心1摘要近年来,自动驾驶因其减轻驾驶员... 查看详情

深度学习目标检测模型综述

...f whaosoftaiot http://143ai.com此分享中调查了基于深度学习的目标检测器的最新发展。还提供了检测中使用的基准数据集和评估指标的简明概述,以及检测任务中使用的一些突出的主干架构。它还涵盖了边缘设备上使用的当代轻... 查看详情

4.基于深度学习的目标检测算法的综述(转)

4.基于深度学习的目标检测算法的综述(转)原文链接:https://www.cnblogs.com/zyly/p/9250195.html目录一相关研究1、选择性搜索(SelectiveSearch)2、OverFeat二、基于区域提名的方法1、R-CNN 2、SPP-Net3、FastR-CNN4、FasterR-CNN5、R-FCN 三端对端的... 查看详情

(转)技术揭秘:海康威视pascalvoc2012目标检测权威评测夺冠之道

...容平台,邀请学术界、工业界一线专家撰稿,致力于推送人工智能与深度学习最新技术、产品和活动信息!      查看详情

深度学习之目标检测(代码片段)

算法的设计往往与名字有着绝对的关联性,目标定位检测即目标定位+检测。在深度学习中比较常用的目标定位检测方法有RCNN系列方法和YOLO系列方法。其中RCNN系列方法的定位过程和检测过程是分开的,即先定位目标&#x... 查看详情

自动驾驶中的三维目标检测综述

点云PCL免费知识星球,点云论文速读。文章:3DObjectDetectionforAutonomousDriving:ASurvey作者:RuiQian,XinLai,andXirongLi编译:点云PCL来源:arXiv2021欢迎各位加入免费知识星球,获取PDF论文,欢迎转发朋友圈。文章... 查看详情

深度学习(综述,2015,应用)

...epLearningAlgorithmswithApplicationstoVideoAnalyticsforASmartCity:ASurvey1.目标检测目标检测的目标是在图像中精确定位目标的位置。已经提出了许多使用深度学习算法的工作。我们回顾如下一些有代表性的工作:Szegedy[28]修改了深度卷积网络,... 查看详情

小白同学高效入门目标检测之yolo实战系列精选|❤️1024专刊❤️

🥇版权:本文由【墨理学AI】原创、在CSDN首发、各位大佬、开打开打❤️YOLO实战,你只看这一篇就够1024,你快乐了吗今年的冬天来早了一些,工地的砖也不那么烫手啦,开心1024,冲动消费了一把,开... 查看详情