正文

在实验中，一共尝试了上面六种模型（每一列是一种模型），模型中都使用了是 3x3 的卷积核大小，在模型 C 中尝试了 1x1 的卷积核，模型的深度从左向右依次增加。为了简洁方便，表格中只展示了卷积操作和池化操作，没有显示激活函数（在每个卷积层和全连接层后都有激活函数）。而且我们发现每层的通道数很小，第一层的通道数只有64，之后每进行一次最大池化，通道数变为之前的2倍，直到增加到512为止。

（下面是16层的 VGGNet 的模型图）

图中符号表示：

conv3-64：卷积核的大小为 3*3，输出通道数为 64
conv1-256：卷积核大小为 1*1，输出通道数为 256
FC-4096：全连接层，输出神经元个数为 4096
FC-1000：全连接层，输出神经元个数为 1000
maxpool：采用最大池化

2.3 DISCUSSION--讨论

1.作者说VGG这个网络与之前的那些人的网络不同，他将 11x11 或 7x7 的卷积核变成了更小的 3x3 卷积核。

2.作者发现如果说2个 3x3 的卷积串联，那么将等。于1个 5x5 的卷积，同理3个 3x3 的卷积串联，那么将等于1个 7x7 的卷积。

3.提出为什么要用3个 3x3 的卷积替代1个 7x7 的卷积?

（1）3层比1层更具有判别性，使用更多的非线性变换，特征学习能力更强;

（2） 3x3 的卷积相比于 7x7 的卷积减少了参数。

3 CLASSIFICATION FRAMEWORK--分类框架

3.1 TRAINING--训练

1.在训练时，使用带动量的最小批梯度下降算法，批量大小设置为256，动量设置为0.9，训练时使用权重衰。减，在第一和第二个全连接层使用丢弃率为0.5的丢弃层，学习率设置为0.01，当验证精度停止提高时，学习率降低10倍。VGG相比于AlexNet训练收敛快的原因是拥有更深的网络和更小的卷积，还有一些层的预初始化。

2.不好的初始化会导致学习的失败，在表1中的配置A，网络较浅的可以采用随机初始化。当训练更深的网络结构时，使用模型A的权重来初始化前四层和最后三层全连接层的参数，其他中间层使用随机初始化。

3.输入图片时进行的数据增强（两种方法）：

（法一）: 选取一个固定的最短边S，相当于单一尺度训练，评估选取两个固定的S，分别为256和384。对于一个给定的神经网络配置，首先训练S=256。为了加速训练S=384的网络，会使用预训练的S=256网络的权重来初始化参数，然后使用更好的初始化学习速率。

（法二）: 设置S为多尺度，每次训练图片，都通过从-确定的范围[Smin, Smax]通常值为Smin=256Smax=512，随机采样一个S，使用此S来缩放图片，因为图片中的物体有不同的尺寸，通过S多尺度，这样的情况就被考虑了进去。

3.2 TESTING--测试

训练时的全连接层在测试时依次变为1个 7x7 的卷积和2个 1x1 卷积。经过转换的网络就没有了全连接层，这样网络就可以接受任意尺寸的输入，而不是像之前之能输入固定大小的输入。

测试总结如下：

（1）用一张测试图片的不同大小进行测试，最后取这些结果的平均值作为该图片的结果，这样也会改善性能。

（2）在最后一个卷积层的最后我们需要做一个最大/平均池化，为了使得能够和全连接层连接上，所以需要将最后一个卷积层的输出进行规定。

（3）通过水平翻转图像增加扩充测试数据集，最后将原始图片和翻转后的图片的结果平均值作为该图片的最终结果。

（4）我们在评估网络时，把每张图片变为3个尺寸，从每个尺寸的图片中随即裁剪出50个不同的图片，然后一张图片就变成了150张图片.

3.3 IMPLEMENTATION DETAILS--实现细节

网络进行训练和评价以及训练和评估全尺寸多尺度图像都是使用一个系统上的多个 GPU 。多 GPU 训练利用数据并行性，将每批训练图像分割成若干 GPU 批次，在每个GPU上并行处理。计算完 GPU 批处理梯度后，取其平均值，得到整个批处理的梯度。梯度计算是同步的跨 GPU，因此结果和单一 GPU 训练是完全相同的。

网络在4个 NVIDIA Titan Black GPUs 训练单个网络花费了 2-3 周。

四、CLASSIFICATION EXPERIMENTS --实验分类

在本节中，介绍单尺寸评估(Single Scale Evaluation)、多尺寸评估(Multi-scale Evaluation)、多裁剪评估(Multi-cropEvaluation)、神经网络融合(ConvNet Fusion)和与其他SOTA模型比较(Comparison with The Stateof The Art)

实验所用数据集：1. 数据种类:1000类 2.训练集:130万张图片 3.验证集:5万张图片 4. 测试集:10万张图片。

4.1 SINGLE SCALE EVALUATION--单尺寸评估

在 Table 3中，展示为单尺寸测试的性能

实验结论：

（1）：这里说相比于A和A-LRN，LRN层无性能增益。所以在之后的四个网络中就不在出现标准化了。

（2）：着深度的增加误差减少，性能提升。

（3）：在深度都为16层的情况下，后三层便用 1x1 卷积的C与使用 3x3 卷积的D性能要差。

（4）当深度不同时，拥有 1x1 卷积的C性能比B好，说明增加非线性是有所帮助的。

（5）尺寸抖动比固定边有更好的结果，说明训练时靠尺寸都能会有所帮助。

4.2 MULTI-SCALE EVALUATION--多尺寸评估

在 Table 4中，展示为多尺寸测试的性能.

在测试时使用尺寸抖动会有更好的表现(与相同的模型在单尺寸相比)，并且越深的模型表现越好，尺寸抖动比使用固定最小边S训练的模型更好。

4.3 MULTI-CROP EVALUATION--多裁剪评估

在Table5中，展示为网络评估技术比较从图可以看出，多裁剪评估(multi-cropevaluation)方法要好于密集评估(denseevaluation)，如果将两者结合起来会有更好的效果。

4.4与4.5 在 Table 6中，展示为多重神经网络融合结果多模型融合是基于多个网络softmax输出的结果的平均。在Table7中，展示与其他SOTA模型比较。

五、 CONCLUSION--结论

最终结论再次强调深度有利于分类的准确性。

总结

论文创新点

（1）整个网络都采用 3x3 的卷积核，从而增加神经网络的深度。两个3x3卷积核的堆叠代替一个5x5卷积核，三个3x3卷积核代替一个7x7卷积核。这样一方面能够减少参数的数量，另一方面拥有更多的非线性变化。
（2）在卷积结构中引入1x1的卷积核，在不影响输入输出维度的情况下，引入非线性变换，增加网络的表达能力，降低计算量.
（3）通过预训练的方式来更好的初始化权重，加快训练的收敛速度
（4）采用 Multi-Scale 的方式训练和预测，可以扩充数据集，防止过拟合，提升预测准确率。
（5）深层网络更适合于大的数据集

论文启发点

（1）深度能够提高网络的分类准确率
（2）为了加快收敛速度，可以使用预训练的方式初始化权重
（3）在更深层的网络中，LRN方法并没有什么用，反而会导致内存和时间的消耗
（4）通过堆叠小卷积核可以减少网络参数，增加网络深度，提升网络性能
（5）在训练和测试使用 Multi-Scale 可以扩充数据集，防止过拟合

resnet论文解读/总结

...exNet：AlexNet论文解读/总结_耿鬼喝椰汁的博客-CSDN博客VGGNet：VGGNet论文解读/总结_耿鬼喝椰汁的博客-CSDN博客GoogLeNet:GoogLeNet(Inception)v1论文解读/总结_耿鬼喝椰汁的博客-CSDN博客ResNet：ResNet论文解读/总结_耿鬼喝椰汁的博... 查看详情

gan总结

GANGAN的原理和推导WGANWGAN原理WGAN的来龙去脉InfoGANinfoGAN解读infoGAN公式推导infoGAN论文解读变分推断变分推断及其求解方法变分推断pix2pixpix2pix论文解读cycleGANCycleGAN论文笔记查看详情

第五篇vggnet——论文翻译

文章目录摘要1引言2ConvNet配置2.1架构2.2配置2.3讨论3分类框架3.1训练3.2测试3.3实现细节查看详情

第五篇vggnet——论文翻译

文章目录摘要1引言2ConvNet配置2.1架构2.2配置2.3讨论3分类框架3.1训练3.2测试3.3实现细节查看详情

yolov2论文解读/总结

本章论文：YOLOv2论文（YOLO9000:Better,Faster,Stronger）（原文＋解读/总结＋翻译）系列论文：YOLOv1论文解读/总结_yolo论文原文_耿鬼喝椰汁的博客-CSDN博客前言在YOLOv1推出一年以后，YOLOv2诞生了&#... 查看详情

微软automl框架之flaml|论文解读

...微软主推的一个全新的高效轻量级自动化机器学习框架。论文arXiv地址|FLAML:AFastandLightweightAutoMLLibraryFLAMLGithub项目地址|AFastLibraryforAutomatedMachineLearning&Tunin 查看详情

ananalysisofscaleinvarianceinobjectdetection–snip论文解读

...且详细的介绍，因此copy过来，自己在前面大体总结一下论文，细节不做赘述，引用文章讲得很详细。论文概述引用文章以下内容来自：http://lowrank.science/SNIP/这篇日志记录一些对下面这篇CVPR2018Oral文章的笔记。SinghB,DavisLS.AnAnalysis... 查看详情

agv调度优化系列论文解读与汇总

这篇博文主要用于记录AGV调度优化的相关文章，包括机器与AGV联合调度及各类车间或其他场景的AGV调度，此处主要总结中文文献，英文文献可见专栏AGV。由于中文文献大多较为简单，所以以下文献皆为... 查看详情

论文解读:attentionisallyouneed

论文解读：AttentionIsAllYouNeed论文解读：AttentionIsAllYouNeed全文摘要译文二、简要信息三、算法模型详解3.1注意力机制3.2Position-wiseFeed-ForwardNetworks3.3位置表征3.4Transf... 查看详情

深入理解conditionaldiffusionmodels：解读《onconditioningtheinputnoiseforcontrolledimagegeneration》

...了现在常用的条件使用方法。最近逛arxiv看到一篇最新的论文主打conditionaldiffusionmodels，和读者一起读一下这篇论文《OnConditioningtheInpu 查看详情

《albert论文解读》

ALBERT论文解读 NLP论文专栏里怎么可能没有关于BERT的论文呢，今天给大家介绍的就是google最近发的一个又一个秒杀各个数据集的模型ALBERT。论文地址：https://openreview.net/pdf?id=H1eA7AEtvS?openreview.netgithub地址(中文预训练模型)... 查看详情

手撕cnn经典网络之vggnet（pytorch实战篇）

...是红色石头！在上一篇文章：手撕CNN经典网络之VGGNet（理论篇）详细介绍了VGGNet的网络结构，今天我们将使用PyTorch来复现VGGNet网络，并用VGGNet模型来解决一个经典的Kaggle图像识别比赛问题。正文开始！... 查看详情

手撕cnn经典网络之vggnet（pytorch实战篇）

《autodl论文解读：基于强化学习的开创性工作》

...在ICLR上各自发表基于强化学习的NAS以来，已产出200多篇论文，仅2019年上半年就有100多篇论文。此系列文章将解读AutoDL领域的经典论文与方法，笔者也是刚接触这个领域，有理解错误的地方还请批评指正！此系列的文章列表：Auto... 查看详情

图像分类算法：resnet论文解读(代码片段)

图像分类算法：ResNet论文解读前言其实网上已经有很多很好的解读各种论文的文章了，但是我决定自己也写一写，当然，我的主要目的就是帮助自己梳理、深入理解论文，因为写文章，你必须把你所写的... 查看详情

正文

vggnet论文解读/总结

系列文章目录

前言

ABSTRACT--摘要

一、INTRODUCTION--介绍

二、CONVNET CONFIGURATIONS--卷积网络配置

2.1 ARCHITECTURE--网络结构

2.2 CONFIGURATIONS--结构

2.3 DISCUSSION--讨论

3 CLASSIFICATION FRAMEWORK--分类框架

3.1 TRAINING--训练

3.2 TESTING--测试

四、CLASSIFICATION EXPERIMENTS --实验分类

4.1 SINGLE SCALE EVALUATION--单尺寸评估

4.2 MULTI-SCALE EVALUATION--多尺寸评估

4.3 MULTI-CROP EVALUATION--多裁剪评估

五、 CONCLUSION--结论

总结

论文创新点

论文启发点

resnet论文解读/总结

gan总结

第五篇vggnet——论文翻译

第五篇vggnet——论文翻译

yolov2论文解读/总结

微软automl框架之flaml|论文解读

ananalysisofscaleinvarianceinobjectdetection–snip论文解读

agv调度优化系列论文解读与汇总

论文解读:attentionisallyouneed

6.3bert论文解读

6.3bert论文解读

6.3bert论文解读

深入理解conditionaldiffusionmodels：解读《onconditioningtheinputnoiseforcontrolledimagegeneration》

《albert论文解读》

手撕cnn经典网络之vggnet（pytorch实战篇）

手撕cnn经典网络之vggnet（pytorch实战篇）

《autodl论文解读：基于强化学习的开创性工作》

图像分类算法：resnet论文解读(代码片段)