efficientdet:快又准,efficientnet作者在目标检测领域的移植cvpr2020

author author     2023-04-15     569

关键词:

参考技术A

论文: EfficientDet: Scalable and Efficient Object Detection

  目前目标检测领域,高精度的模型通常需要很大的参数量和计算量,而轻量级的网络则一般都会牺牲精度。因此,论文希望建立一个可伸缩的高精度且高性能的检测框架。论文基于one-stage的检测网络范式,进行了多种主干网络、特征融合和class/box预测的结构尝试,主要面临两个挑战:

  FPN是目前最广泛的多尺度融合方法,最近也有PANet和NAS-FPN一类跨尺度特征融合方法。对于融合不同的特征,最初的方法都只是简单地直接相加,然而由于不同的特征是不同的分辨率,对融合输出特征的共享应该是不相等的。为了解决这一问题,论文提出简单但高效加权的bi-directional feature pyramid network(BiFPN),该方法使用可学习的权重来学习不同特征的重要性,同时反复地进行top-down和bottom-up的多尺度融合

  论文认为除了缩放主干网络和输入图片的分辨率,特征网络(feature network)和box/class预测网络的缩放对准确率和性能也是很重要的。作者借鉴EfficientNet,提出针对检测网络的混合缩放方法(compound scaling method),同时对主干网络,特征网络和box/class预测网络的分辨率/深度/宽度进行缩放

  最后,论文将EfficientNet作为主干,结合BiFPN和混合缩放,提出新的检测系列EfficientDet,精度高且轻量,COCO上的结果如图1,论文的贡献有以下3点:

  定义多尺寸特征 ,论文的目标是找到变化函数 来高效融合不同的特征,输出新特征 。具体地,图2a展示了top-down FPN网络结构,一般FPN只有一层,这里应该为了对比写了repeat形式。FPN获取3-7层的输入 , 代表一个分辨率为 的特征层

  top-down FPN操作如上所示, 为上采用或下采样来对齐分辨率, 通常是特征处理的卷积操作

  top-down FPN受限于单向的信息流,为了解决这一问题,PANet(图2b)增加了额外的bottom-up路径的融合网络,NAS_FPN(图2c)使用神经架构搜索来获取更好的跨尺度特征网络的拓扑结构,但需要大量资源进行搜索。其中准确率最高的是PANet,但是其需要太多的参数和计算量,为了提高性能,论文对跨尺寸连接做了几点改进:

  大多的特征融合方法都将输入特征平等对待,而论文观察到不同分辨率的输入对融合输出的特征的贡献应该是不同的。为了解决这一问题,论文提出在融合时对输入特征添加额外的权重预测,主要有以下方法:

  , 是可学习的权重,可以是标量(per-feature),也可以是向量(per-channel),或者是多维tensor(per-pixel)。论文发现标量形式已经足够提高准确率,且不增加计算量,但是由于标量是无限制的,容易造成训练不稳定,因此,要对其进行归一化限制

  ,利用softmax来归一化所有的权重,但softmax操作会导致GPU性能的下降,后面会详细说明

  ,Relu保证 , 保证数值稳定。这样,归一化的权重也落在 ,由于没有softmax操作,效率更高,大约加速30%

  BiFPN集合了双向跨尺寸的连接和快速归一化融合,level 6的融合操作如上, 为top-down路径的中间特征, 是bottom-up路径的输出特征,其它层的特征也是类似的构造方法。为了进一步提高效率,论文特征融合时采用depthwise spearable convolution,并在每个卷积后面添加batch normalization和activation

  EfficientDet的结构如图3所示,基于one-stage检测器的范式,将ImageNet-pretrained的EfficientNet作为主干,BiFPN将主干的3-7层特征作为输入,然后重复进行top-down和bottom-up的双向特征融合,所有层共享class和box网络

  之前检测算法的缩放都是针对单一维度的,从EfficientNet得到启发,论文提出检测网络的新混合缩放方法,该方法使用混合因子 来同时缩放主干网络的宽度和深度、BiFPN网络、class/box网络和分辨率。由于缩放的维度过多,EfficientNet使用的网格搜索效率太慢,论文改用heuristic-based的缩放方法来同时缩放网络的所有维度

  EfficientDet重复使用EfficientNet的宽度和深度因子,EfficinetNet-B0至EfficientNet-B6

  论文以指数形式来缩放BiFPN宽度 (#channels),而以线性形式增加深度 (#layers),因为深度需要限制在较小的数字

  box/class预测网络的宽度固定与BiFPN的宽度一致,而用公式2线性增加深度(#layers)

  因为BiFPN使用3-7层的特征,因此输入图片的分辨率必需能被 整除,所以使用公式3线性增加分辨率

  结合公式1-3和不同的 ,论文提出EfficientDet-D0到EfficientDet-D6,具体参数如Table 1,EfficientDet-D7没有使用 ,而是在D6的基础上增大输入分辨率

  模型训练使用momentum=0.9和weight decay=4e-5的SGD优化器,在初始的5%warm up阶段,学习率线性从0增加到0.008,之后使用余弦衰减规律(cosine decay rule)下降,每个卷积后面都添加Batch normalization,batch norm decay=0.997,epsilon=1e-4,梯度使用指数滑动平均,decay=0.9998,采用 和 的focal loss,bbox的长宽比为 ,32块GPU,batch size=128,D0-D4采用RetinaNet的预处理方法,D5-D7采用NAS-FPN的增强方法

  Table 2展示了EfficientDet与其它算法的对比结果,EfficientDet准确率更高且性能更好。在低准确率区域,Efficient-D0跟YOLOv3的相同准确率但是只用了1/28的计算量。而与RetianaNet和Mask-RCNN对比,相同的准确率只使用了1/8参数和1/25的计算量。在高准确率区域,EfficientDet-D7达到了51.0mAP,比NAS-FPN少使用4x参数量和9.3x计算量,而anchor也仅使用3x3,非9x9

  论文在实际的机器上对模型的推理速度进行了对比,结果如图4所示,EfficientDet在GPU和CPU上分别有3.2x和8.1x加速

  论文对主干网络和BiFPN的具体贡献进行了实验对比,结果表明主干网络和BiFPN都是很重要的。这里要注意的是,第一个模型应该是RetinaNet-R50(640),第二和第三个模型应该是896输入,所以准确率的提升有一部分是这个原因。另外使用BiFPN后模型精简了很多,主要得益于channel的降低,FPN的channel都是256和512的,而BiFPN只使用160维,这里应该没有repeat

  Table 4展示了Figure 2中同一网络使用不同跨尺寸连接的准确率和复杂度,BiFPN在准确率和复杂度上都是相当不错的

  Table 5展示了不同model size下两种加权方法的对比,在精度损失不大的情况下,论文提出的fast normalized fusion能提升26%-31%的速度

  figure 5展示了两种方法在训练时的权重变化过程,fast normalizaed fusion的变化过程与softmax方法十分相似。另外,可以看到权重的变化十分快速,这证明不同的特征的确贡献是不同的,

  论文对比了混合缩放方法与其它方法,尽管开始的时候相差不多,但是随着模型的增大,混合精度的作用越来越明显

  论文提出BiFPN这一轻量级的跨尺寸FPN以及定制的检测版混合缩放方法,基于这些优化,推出了EfficientDet系列算法,既保持高精度也保持了高性能,EfficientDet-D7达到了SOTA。整体而言,论文的idea基于之前的EfficientNet,创新点可能没有之前那么惊艳,但是从实验来看,论文推出的新检测框架十分实用,期待作者的开源



别乱用,这样打日志定位bug又快又准!(代码片段)

点击关注公众号,实用技术文章及时了解来源:blog.csdn.net/linsongbin1/article/details/90349661概述日常工作中,程序员需要经常处理线上的各种大小故障,如果业务代码没打印日志或者日志打印的不好,会极大的加大... 查看详情

yolov6又快又准的目标检测框架已开源

siou精度是最高的,其次是yoloe,但是没开源:即插即用|SIoU实现50.3AP+7.6ms检测速度精度、速度完美超越YoloV5、YoloX_AI视觉网奇的博客-CSDN博客先看YOLOv6精度:ModelSizemAPval0.5:0.95SpeedV100fp16b32(ms)SpeedV100fp32b32(ms)Spe 查看详情

华为云技术分享介绍一个又快又准的截图骚操作

截图是可以说是每个人必备的技能,有时候需要截个手机屏,有时候需要截个网页屏,方式有很多,各种快捷键和插件也都能够办到。但下面这个情况不知道大家会怎么来做。需求切入有一天,我在电脑上看到了一条微博,或者... 查看详情

yolov6:又快又准的目标检测框架开源啦

近日,美团视觉智能部研发了一款致力于工业应用的目标检测框架YOLOv6,能够同时专注于检测的精度和推理效率。在研发过程中,视觉智能部不断进行了探索和优化,同时吸取借鉴了学术界和工业界的一些前沿进... 查看详情

实现pytorch版efficientdet的全过程(代码片段)

...amlpipinstalltorch==1.4.0pipinstalltorchvision==0.5.0二、下载pytorch版efficientdet源码gitclonehttps://github.com/zylo117/Yet-Another-EfficientDet-Pytorch.git源码链接:https://github.com/zylo117/Yet-Another-EfficientDet-Pytorch三、准备数据集#yourdatasetstructureshouldbelikethisdata... 查看详情

将保存的 EfficientDet 模型 saved_model.pb 转换为 tflite 格式失败

】将保存的EfficientDet模型saved_model.pb转换为tflite格式失败【英文标题】:FailtoconvertsavedEfficientDetmodelsaved_model.pbtotfliteformat【发布时间】:2021-11-1803:11:33【问题描述】:我已经使用TF2API训练了一个EfficientDet-d0模型,以便检测自定义... 查看详情

小白学习tensorflow教程四使用tfhub中的模型efficientdet-lite2进行对象检测(代码片段)

...练好的模型的一个仓库。今天,我使用tfhub中的模型EfficientDet-Lite2进行对象检测选择的模型是EfficientDet-Lite2对象检测模型。它在具有91个不同标签的COCO17数据集上进行了训练,并针对TFLite应用程序进行了优化。EfficientDet 查看详情

efficientdet:scalableandefficientobjectdetection

...和EfficientNet主干网,我们开发了一个新的对象检测器家族EfficientDet,它在广泛的资源限制范围内始终比现有技术获得更好的效率。特别是,在单模型和单尺度的情况下,我们的EfficientDet7在COCO测试设备上实现了最先进的52.2AP,具... 查看详情

efficientdet

...式           2、EfficientDet  (1)结构图  & 查看详情

论文解读:learningtoautofocus

...环节,相信绝大多数的用户,对于AF的要求都是又快又准,相机由于镜头的特性,一般来说只能在一定范围内成像 查看详情

codeforbetter谷歌开发者之声——基于谷歌开源efficientdet的电网缺陷的识别检测

...测速度和精度无法同时满足的问题,提出一种改进的EfficientDet目标检测算法,该算法应用于无人机电力巡检图像的数据挖掘,对高压输电线路上的绝缘子、防震锤、均压环、屏蔽环、鸟巢同时进行目标检测及缺陷定位... 查看详情

小白学习tensorflow教程四使用tfhub中的模型efficientdet-lite2进行对象检测(代码片段)

...练好的模型的一个仓库。今天,我使用tfhub中的模型EfficientDet-Lite2进行对象检测选择的模型是EfficientDet-Lite2对象检测模型。它在具有91个不同标签的COCO17数据集上进行了训练,并针对TFLite应用程序进行了优化。EfficientDet-Lit... 查看详情

把倒计时做到极致,又准又稳!(代码片段)

相关阅读:一个90后员工猝死的全过程快手电商无线团队-小政|作者承香墨影|编辑https://juejin.cn/post/6984725689257689101|原文能上架的App,都逃不过一个倒计时的功能,手机验证码登录总归是要实现的。那这个功能中,... 查看详情

yolov4怎么判断两个物体位置

...的目标检测模型。你只要有1080Ti或2080TiGPU就能训练一个又快又准的objectdetector。验证了两个state-of-the-art方法Bag-of-Freebies和Bag-of-Specials在目标检测的效果。 查看详情

开源了!文心大模型ernie-tiny轻量化技术,又准又快,效果全开

1大模型落地之路维艰近年来,随着深度学习技术的迅速发展,大模型预训练范式通过一次次刷新各种评测基线,证明了其卓越的学习与迁移能力。在这个过程中,研究者们发现通过不断扩大模型参数能持续提升深... 查看详情

开源了!文心大模型ernie-tiny轻量化技术,又准又快,效果全开

1大模型落地之路维艰近年来,随着深度学习技术的迅速发展,大模型预训练范式通过一次次刷新各种评测基线,证明了其卓越的学习与迁移能力。在这个过程中,研究者们发现通过不断扩大模型参数能持续提升深... 查看详情

怎么让word编辑公式又快又好

...个简单的公式。那这篇文章就告诉Word公式怎么编辑才又快又好。想要在Word中编辑出完美的公式,那MathType是一个非常有必要的工具。如 查看详情

it运维如何又快又好的进行数据备份?

...的硬盘或阵列复制到其它的存储介质的过程。那么如何又快又好的进行数据备份?用什么工具好?如何又快又好的进行数据备份?这里我给大家推荐一个非常好用的数据自动化备份工具,那就是行云管家。在行云... 查看详情