深度学习目标检测模型综述

tt姐 tt姐     2022-12-08     654

关键词:

还是学习啊 勿怪勿怪 给自己好保存而已哦

论文地址:https://arxiv.org/pdf/2104.11892.pdf

 whaosoft aiot http://143ai.com

此分享中调查了基于深度学习的目标检测器的最新发展。还提供了检测中使用的基准数据集和评估指标的简明概述,以及检测任务中使用的一些突出的主干架构。它还涵盖了边缘设备上使用的当代轻量级分类模型。最后,我们比较了这些架构在多个指标上的性能。

背景

  • 问题陈述

目标检测是物体分类的自然延伸,其目的只是识别图像中的物体。目标检测的目标是检测预定义类的所有实例,并通过轴对齐框在图像中提供其粗略定位。检测器应该能够识别目标类的所有实例并在其周围绘制边界框。它通常被视为一个有监督的学习问题。现代目标检测模型可以访问大量标记图像进行训练,并在各种规范基准上进行评估。

  • 目标检测的主要挑战

计算机视觉在过去十年中取得了长足的进步,但仍有一些重大挑战需要克服。网络在现实生活应用中面临的一些关键挑战包括:

• 类内变化:同一目标的实例之间的类内变化在本质上是相对常见的。这种变化可能是由于各种原因造成的,例如遮挡、照明、姿势、视点等。这些不受约束的外部可能会对目标外观产生巨大影响。预计目标可能具有非刚性变形或旋转、缩放或模糊。一些物体可能有不显眼的环境,使提取变得困难。

• 类别数量:可用于分类的目标类别的绝对数量使其成为一个难以解决的问题。它还需要更多高质量的标签数据,这很难获得。使用更少的示例来训练检测器是一个开放的研究问题。

• 效率:当今的模型需要大量计算资源来生成准确的检测结果。随着移动和边缘设备的普及,高效的物体检测器对于计算机视觉领域的进一步发展至关重要。

数据集和评估指标

 

目标检测器使用多个标准来衡量检测器的性能,即每秒帧数 (FPS)、精度和召回率。然而,平均精度(mAP)是最常见的评估指标。精度来自于联合交集(IoU),它是GT实况与预测边界框之间的重叠面积与联合面积的比值。设置阈值以确定检测是否正确。如果IoU大于阈值,则将其分类为True Positive,而IoU低于阈值则将其分类为False Positive。如果模型未能检测到地面实况中存在的对象,则称为假阴性。精度衡量正确预测的百分比,而召回衡量关于基本事实的正确预测。

常见主干网络

常见目标检测框架

我们根据两种类型的检测器(两级和单级检测器)划分了这篇评论。然而,我们也讨论了开创性的工作,我们简要检查了一些传统的物体检测器。具有生成区域建议的单独模块的网络称为两阶段检测器。这些模型在第一阶段尝试在图像中找到任意数量的对象建议,然后在第二阶段对它们进行分类和定位。由于这些系统有两个独立的步骤,它们通常需要更长的时间来生成候选,具有复杂的架构并且缺乏全局上下文。

单级检测器使用密集采样在一次过程中对目标进行分类和定位。他们使用各种比例和纵横比的预定义框/关键点来定位目标。它在实时性能和更简单的设计方面超越了两级检测器。

轻量级网络

近年来形成了一个新的研究分支,旨在为物联网 (IoT) 部署中常见的资源受限环境设计小型高效网络。这种趋势也渗透到了强大的物体检测器的设计中。可以看出,尽管大量目标检测器实现了出色的准确性并实时执行推理,但这些模型中的大多数都需要过多的计算资源,因此无法部署在边缘设备上。

过去,许多不同的方法都显示出令人兴奋的结果。利用高效组件和压缩技术,如修剪、量化、hashing等,提高了深度学习模型的效率。使用经过训练的大型网络来训练较小的模型,称为蒸馏,也显示出有趣的结果。然而,在本节中,我们将探讨一些用于在边缘设备上实现高性能的高效神经网络设计的突出示例。

深度学习(综述,2015,应用)

...标是在图像中精确定位目标的位置。已经提出了许多使用深度学习算法的工作。我们回顾如下一些有代表性的工作:Szegedy[28]修改了深度卷积网络,用回归层代替最后一层,目的是针对目标的box产生一个binarymask, 查看详情

基于深度学习的目标检测算法综述

基于深度学习的目标检测算法综述(一)基于深度学习的目标检测算法综述(二)基于深度学习的目标检测算法综述(三)本文内容原创,作者:美图云视觉技术部检测团队,转载请注明出处目... 查看详情

目标检测综述

...分享一下,将介绍计算机视觉中的目标检测任务,论述自深度学习以来目标检测的常见方法,着重讲yolo算法,并且将yolo算法与其他的one-stage以及two-stage方法进行比较。目录1.介绍2.YOLO2.1YOLOv12.2YOLOv22.3YOLOv33.其他方法RCNNFastRCNNFaster... 查看详情

[转]目标检测入门之综述(上)

...解析出可供计算机理解的信息,是机器视觉的中心问题。深度学习模型由于其强大的表示能力,加之数据量的积累和计算力的进步,成为机器视觉的热点研究方向。 那么,如何理解一张图片?根据后续任务的需要,有三个主... 查看详情

如何快速入门深度学习目标检测?

学习目标了解目标检测的任务知道目标检测的常用数据集知道目标检测算法的评价指标掌握非极大值NMS算法的应用了解常用的目标检测算法分类1.目标检测目标检测(ObjectDetection)的任务是找出图像中所有感兴趣的目标,并确定... 查看详情

基于区域的二阶段算法思想和理解综述

...目标检测是图像处理领域的基础。自从2012年CNN的崛起,深度学习在Detection的持续发力,为这个领域带来了变革式的发展。深度学习出现之前,传统的目标检测方法大概分为区域选择(滑动窗口)、特征提取(SIFT、HOG、LBP、DPM等... 查看详情

目标跟踪综述(主要是深度学习)

摘要近年来,深度学习方法在物体跟踪领域有不少成功应用,并逐渐在性能上超越传统方法。本文对现有基于深度学习的目标跟踪算法进行了分类梳理。经典的目标跟踪方法目前跟踪算法可以被分为产生式(generativemodel)和判别式(... 查看详情

2020厦门大学综述翻译:3d点云深度学习(remotesensiong期刊)

目录摘要1、引言:2、点云深度学习的挑战3、基于结构化网格的学习3.1基于体素3.2基于多视图3.3高维晶格4、直接在点云上进行的深度学习4.1PointNet4.2局部结构计算方法4.2.1不探索局部相关性的方法4.2.2探索局部相关性的方法4.3基... 查看详情

keras深度学习实战(15)——从零开始实现yolo目标检测(代码片段)

Keras深度学习实战(15)——从零开始实现YOLO目标检测0.前言1.YOLO目标检测模型1.1锚框(anchorboxes)1.2YOLO目标检测模型原理2.从零开始实现YOLO目标检测2.1加载数据集2.2计算锚框尺寸2.3创建训练数据集2.4实现YOLO目标检测模型2.5... 查看详情

人工智能之目标检测系列综述

.../article/details/89111539时间线慢慢补充正文1.传统目标检测在深度学习出现之前,传统的目标检测方法大概分为 查看详情

深度学习-综述

【编者按】深度学习领域的三位大牛YannLeCun、YoshuaBengio和GeoffreyHinton无人不知无人不晓。此前,为纪念人工智能提出60周年,YannLeCun、YoshuaBengio和GeoffreyHinton首次合作了这篇综述文章“DeepLearning”。 该综述文章中文译文的上半... 查看详情

深度学习在视频多目标跟踪中的应用综述

...经典的指标完整的MOT指标ID分数2.3、基准数据集3、MOT中的深度学习3.1、深度学习中的检测步骤3.1.1、FasterR-CNN3.1.2、SSD3.1.3、Otherdetectors3.1.4、cnn在检测步骤中的其他用途3.2、深度学习在特征提取和运动预测中的应用3.2.1、自动编码... 查看详情

深度学习在视频多目标跟踪中的应用综述

...经典的指标完整的MOT指标ID分数2.3、基准数据集3、MOT中的深度学习3.1、深度学习中的检测步骤3.1.1、FasterR-CNN3.1.2、SSD3.1.3、Otherdetectors3.1.4、cnn在检测步骤中的其他用途3.2、深度学习在特征提取和运动预测中的应用3.2.1、自动编码... 查看详情

深度学习在计算机视觉中应用综述

...计算所山世光教授于2017年1月7日于北京师范大学所做的《深度学习在计算机视觉中的应用与前景》讲座的内容总结梳理。1视觉智能的内涵计算机视觉系统的任务就是像人一样描述摄像机拍摄到的内容。常见的视觉任务:距离... 查看详情

计算机视觉系列最新论文(附简介)

...算机视觉系列最新论文(附简介)目标检测1. 综述:深度域适应目标检测标题:DeepDomainAdaptiveObjectDetection:aSurvey作者:WanyiLi,PengWang链接:https://arxiv.org/abs/2002.06797本文共梳理了40篇相关文献,由中科院自动化所学者发布。基于... 查看详情

视频异常检测综述

...检测方法使用两类表示:手工制作的特征和来自CNN的深度特征。手工制作的特征包括时空梯度、动态纹理、梯度直方图、流直方图、流场、密集轨迹和前景掩码。深度特征可以直接从预训练网络中提取,或者在优化与异... 查看详情

目标检测——深度学习下的小目标检测(检测难的原因和tricks)

小目标难检测原因主要原因(1)小目标在原图中尺寸比较小,通用目标检测模型中,一般的基础骨干神经网络(VGG系列和Resnet系列)都有几次下采样处理,导致小目标在特征图的尺寸基本上只有个位数的像素大小,导致设计的... 查看详情

深度学习实战——不同方式的模型部署(cnnyolo)(代码片段)

...PAI-EAS1.2PAI-Blade2.参考资料系列文章目录本系列博客重点在深度学习相关实践(有问题欢迎在评论区讨论指出,或直接私信联系我)。第一章  深度学习实战——不同方式的模型部署 查看详情