正文

特征点检测目标检测交并比非最大值抑制锚框yolo算法候选区域

劳埃德·福杰  劳埃德·福杰  2023-04-07  658

关键词：

1.特征点检测(Landmark detection)

如果要做一个人脸识别的基本构造模块。

首先需要选择一些特征点，帮助定义脸部轮廓、眼睛位置等脸部特征，假设选定64个特征点。

然后将人脸图片送进卷积网络中训练，网络输出为：这64个特征点的位置+是否有人脸标记(0或1)。

2.目标检测(object detection)

目标检测包括定位和分类两步。

比如下图想检测汽车，假设最后一层输出四个类别的概率，pedestrian、car、motorcycle、background。

为该监督学习任务定义目标标签(target label)：y=[ $\text{[math]}$ $\text{[math]}$ $\text{[math]}$ $\text{[math]}$ $\text{[math]}$ $\text{[math]}$ $\text{[math]}$ $\text{[math]}$ $\text{[math]}$

$\text{[math]}$ ：是否有任何物体(取值为0或1)， $\text{[math]}$ 、 $\text{[math]}$ 、 $\text{[math]}$ 分别表示各个类别的概率。

如何通过卷积网络进行对象检测？

采用基于滑动窗口的目标检测算法。

首先，将识别汽车的卷积网络训练好。

然后，选定某一个大小的窗口，以固定步幅滑动窗口，遍历图像的每个区域。将遍历过程中剪切的小图像输入上面训练好的卷积网络，分别按照0或1进行分类。

如果检测不到，就不断扩大滑动的窗口，重复上述步骤，总能检测到目标对象(如果确实有的话)。

如果你把滑动窗口截取的图像一个个送进网络，计算成本太高。

把整张图片输入给卷积网络进行计算，可以减少计算成本，因为有太多重复的计算。不需要把输入图片分割成4个子集，分别执行向前传播。

3.更精准的边界框(more accurate bounding boxes)

有时候用滑动窗口无法精确定位目标。那么，如何得到更精准的边界框？

yolo算法将输入图像用网格进行分割，每一个格子的图片在训练的时候对应一个标签y。

目标对象的中点在哪个格子，就属于哪个格子。

4.交并比(IoU，intersection over union)

交并比：预测边界框和实际边界框的交集和并集之比，用于衡量定位精度的。一般IoU>=0.5，预测边界框就算正确。

5.非最大值抑制(non-max suppression)

非最大值抑制：保证算法对每个目标对象只检测输出一次。

举例解释：如果想要检测车的位置。如下图，将图片分割成19x19的格子，这361个格子都会执行图像检测的算法。显然，车会覆盖很多格子，最后可能输出多个检测的边界框。如右图。

为了使只有一个边界框作出有车的预测，计算每个边界框的IoU，IoU最大的边界框作出有车的预测，其它IoU较小的就被"抑制"了，被清理掉。

6.锚框(Anchor boxes)

如何让一个格子检测出多个目标对象？

如下图，人和车的中点都落在一个格子里。预先定义两个不同形状的Anchor box，定义标签y。

分别计算预测目标的边界框和这两个Anchor box的IoU，选择最大的那个，即给目标对象既分配一个格子，也分配一个Anchor box。

7.YOLO算法(you only look once)

训练

假设使用3x3的网格。识别3个物体(行人、汽车、摩托车)。两个anchor box，分别对应行人和汽车。单个格子的图片对应的标签y有16位(c1,c2,c3表示识别为这3个类别的概率，两个 $\text{[math]}$ 分别表示是不是行人、是不是汽车)。整个图片送进卷积网络，输出尺寸为3x3x16。

8.候选区域(Region proposals)

R-CNN：带区域的CNN，仅选择图像上的某些区域，运行卷积网络分类器。毕竟有些区域只有背景不含目标对象，没必要也把它送进网络中去预测。

我们利用图像分割算法(segmentation algorithm)去找出可能存在对象的区域。

在此基础上的改进算法：Fast R-CNN、Faster R-CNN

openmmlab目标检测(代码片段)

OpenMMLab目标检测1.目标检测简介1.1滑窗2.基础知识2.1边界框（BoundingBox）2.2交并比IntersectionOverUnion2.3置信度ConfidenceScore2.4非极大值抑制Non-MaximumSuppression2.5边界框回归BoundingBoxRegression2.6边界框编码BboxCoding3.两阶段目标检测算... 查看详情

目标检测yolov3基本思想(代码片段)

...大小3.2.3.求解预测框3.3.标注候选区域4.卷积神经网络提取特征4.1.骨干网络4.2.根据输出特征图计算预测框位置和类别5.损失函数5.1.三种类型5.2.三种尺度5.3.总的损失函数6.非极大值抑制1.简介参考源于产业实践的开源深度学习平台... 查看详情

目标检测yolov3基本思想(代码片段)

intersection-over-union(iou:交并比)

在目标检测的评价体系中，有一个参数叫做IoU(交并比)，即模型产生的目标窗口与原来标记窗口的交叠率。可以简单理解为：检测结果(DetectionResult)与GroundTruth的交集比上它们的并集，即为检测的准确率IoU：用公式表示为：理想情... 查看详情

非最大抑制，挑选和目标重叠框yolo思想原理

...据分类器类别分类概率做排序，(框的类别排序)搜索局部最大值，抑制不是最大的元素。非最大抑制为什么boxbunding要做回归，因为box周围点相对中心锚点的位置是线性函数所以要做回归比较好。yolo想法：分成sxs个格子，每个格... 查看详情

yolo目标检测实战项目『原理篇』

...括24个卷积层和2个全连接层。其中，卷积层用来提取图像特征，全连接层用来预测图像位置和类别概率值。如上图所示，损失函数分为坐标预测（蓝色框）、含有物体的边界框的confidence预测（红色框）、不含有物体的边界框的co... 查看详情

yolo目标检测之iou计算及其衍变体(代码片段)

IOU损失函数目前主要应用于目标检测的领域，其演变的过程如下：IOU-->GIOU-->DIOU-->CIOU损失函数，每一种损失函数都较上一种损失函数有所提升。下面来具体介绍这几种损失函数。IOU(IntersectionoverUnion)IoU就是我们... 查看详情

keras深度学习实战（15）——从零开始实现yolo目标检测(代码片段)

Keras深度学习实战（15）——从零开始实现YOLO目标检测0.前言1.YOLO目标检测模型1.1锚框(anchorboxes)1.2YOLO目标检测模型原理2.从零开始实现YOLO目标检测2.1加载数据集2.2计算锚框尺寸2.3创建训练数据集2.4实现YOLO目标检测模型2.5... 查看详情

目标检测算法详解yolo(youonlylookonce)

YOLO：Youonlylookonce学习目标1.YOLO1.1结构1.2流程理解2.单元格(gridcell)2.1网格输出筛选3.非最大抑制(NMS)4.训练5.与FasterR-CNN比较6.YOLO总结7.总结学习目标目标知道YOLO的网络结构知道单元格的意义知道YOLO的损失在正式介绍YOLO之前࿰... 查看详情

目标检测yolo系列-yolo_v5学习笔记

文章参考自江大白知乎文章，作为yoloV5的学习记录笔记。知乎链接：https://zhuanlan.zhihu.com/p/172121380目录一、Yolov5四种网络模型二、yolo_v5改进点详解1输入端改进1）Mosaic数据增强2）自适应锚框计算3）自适应图片... 查看详情

目标检测yolo系列-yolo_v5学习笔记

智能视觉食用指南(代码片段)

...测填补padding卷积步长3D卷积三类神经层卷积层：提取特征池化层：降维深度卷积网络呼吸巨人的气息LeNet-5AlexNetVGGNetResNet1*1卷积：降维/升维GoogLeNet对象检测目标定位特征点检测滑动窗口检测YOLO检测交并比非极大值抑... 查看详情

目标检测计算两个标注框的交并比（python代码）(代码片段)

defiou(box1,box2):'''两个框（二维）的iou计算box:[xmin,ymin,xmax,ymax],依次为左上、右下坐标@return:IOU值'''h=max(0,min(box1[2],box2[2])-max(box1[0],box2[0])) w=max(0,min(box1[3],box2[3])-max(box1[1],box2[1]))area_box1=((box1[2]-bo... 查看详情

睿智的目标检测51——tensorflow2搭建yolo3目标检测平台(代码片段)

...解析二、网络结构解析1、主干网络Darknet53介绍2、构建FPN特征金字塔进行加强特征提取3、利用YoloHead获得预测结果三、预测结果的解码1、什么是先验框2、获得先验框后做什么5、得分筛选与非极大抑制四、训练部分1、计算loss所... 查看详情

目标检测评价指标总结

...，ROC曲线，AP的值，AUC的值以及很重要的mAP指标，模型的检测速度和非极大值抑制的相关方面来学习下目标检测中的评价指标。交并比IoU是英文intersectionoverunion的简写，意思是检测结果的矩形框与样本标注的矩形框的交集与并集... 查看详情

[yolo专题-2]：总体-yolo目标检测的网络总体架构与核心概念

...angWenBing/article/details/122118894目录前言说明：第1章目标检测1.1什么是目标/物体（Object）1.2 目标检测（Objectdetect）1.3一步(onestage)与两步(Twostage)1.4分类（Classfic）与回归（Regression）第2章输入与网... 查看详情

计算机视觉知识点——交并比（iou）及其若干改进

...点GIoULoss公式及示意图缺点DIoU公式及示意图CIoU前言目标检测是一个常见的计算机视觉任务，在目标检测任务中，交并比作为评判检测框的标准具有很重要的意义，在实际的应用中，人们又对最初的IoU进行了诸多的... 查看详情

pytorch机器学习——目标检测中k-means聚类方法生成锚框anchor(代码片段)

Pytorch机器学习（十）——YOLO中k-means聚类方法生成锚框anchor目录Pytorch机器学习（十）——YOLO中k-means聚类方法生成锚框anchor前言一、K-means聚类 k-means代码k-means++算法二、YOLO中使用k-means聚类生成anchor读取VOC... 查看详情