正文

（机器学习深度学习常用库框架|pytorch篇）第（待定）节：卷积神经网络cnn中一些经典网络结构写法(代码片段)

快乐江湖  快乐江湖  2023-01-06  130

关键词：

文章目录

一：LeNet-5
二：AlexNet
三：VGG
四：ResNet
五：MobileNetV1
六：InceptionNet

一：LeNet-5

LeNet-5：LeNet-5是一个较简单的卷积神经网络。下图显示了其结构：输入的二维图像，先经过两次卷积层到池化层，再经过全连接层，最后使用softmax分类作为输出层

网络结构

class LeNet5(nn.Module):
    """ 使用sequential构建网络，Sequential()函数的功能是将网络的层组合到一起 """

    def __init__(self, in_channel, output):
        super(LeNet5, self).__init__()
        """
        卷积核5×5
        卷积核数目 6
        步幅1
        填充2

        池化层2×2
        步幅2
        """
        self.layer1 = nn.Sequential(
            nn.Conv2d(in_channels=in_channel, out_channels=6, kernel_size=5, stride=1, padding=2),  # (6, 28, 28)
            nn.Tanh(),
            nn.AvgPool2d(kernel_size=2, stride=2, padding=0))  # (6, 14, 14))
        """
        卷积核5×5
        卷积核数目 16
        步幅1
        填充0

        池化层2×2
        步幅2

        """
        self.layer2 = nn.Sequential(nn.Conv2d(in_channels=6, out_channels=16, kernel_size=5, stride=1, padding=0),
                                    # (16, 10, 10)
                                    nn.Tanh(),
                                    nn.AvgPool2d(kernel_size=2, stride=2, padding=0))  # (16, 5, 5)

        # 全连接层1（可用卷积层代替）

        self.layer3 = nn.Conv2d(in_channels=16, out_channels=120, kernel_size=5)  # (120, 1, 1)

        # 全连接层2、3

        self.layer4 = nn.Sequential(nn.Linear(in_features=120, out_features=84),
                                    nn.Tanh(),
                                    nn.Linear(in_features=84, out_features=output))

    def forward(self, x):
        x = self.layer1(x)
        x = self.layer2(x)
        x = self.layer3(x)
        # 进入全连接层前展平
        x = torch.flatten(input=x, start_dim=1)
        x = self.layer4(x)
        return x

二：AlexNet

AlexNet：Alex网络结构如下图所示，其设计理念和LeNet-5非常相似，主要区别如下

网络结构要比LeNet5深很多
由5个卷积层、两个全连接层隐藏层和一个全连接输出层组成
AlexNet使用ReLU作为激活函数
AlexNet第一层的卷积核比较大，为11×11，这是因为ImageNet中大多图像要比MNIST图像多10倍以上
AlexNet使用dropout算法来控制全连接层复杂程度，而LeNet5只使用了权重衰减
AlexNet对图像数据进行了增广（例如对一张图像翻转、裁切和变色相等于有了3张以上的图像），这增大了样本量，减少了过拟合

网络结构

import numpy
import torch
import torch.nn as nn
import torch.nn.functional as F

class AlexNet(nn.Module):
    """
        out_dim：最终分类的数目
        init_weights：设置是否初始化权重，默认为False
    """
    def __init__(self, num_classes, init_weights=False):
        super(AlexNet, self).__init__()

        # 标准AlexNet
        self.conv = nn.Sequential(
            # [224, 224, 3] -> [55, 55, 96]
            # [55, 55, 96] -> [27, 27, 96]
            nn.Conv2d(3, 96, kernel_size=11, stride=4, padding=2),
            nn.ReLU(),  # 可以载入更大的模型
            nn.MaxPool2d(kernel_size=3, stride=2),

            # [27, 27, 96] -> [27, 27, 256]
            # [27, 27, 256] -> [13, 13, 256]
            nn.Conv2d(96, 256, kernel_size=5, padding=2),
            nn.ReLU(),
            nn.MaxPool2d(kernel_size=3, stride=2),

            # [13, 13, 256] -> [13, 13, 384]
            # [13, 13, 384] -> [13, 13, 384]
            # [13, 13, 384] -> [13, 13, 256]
            # [13, 13, 256] -> [6, 6, 256]
            nn.Conv2d(256, 384, kernel_size=3, padding=1),
            nn.ReLU(),
            nn.Conv2d(384, 384, kernel_size=3, padding=1),
            nn.ReLU(),
            nn.Conv2d(384, 256, kernel_size=3, padding=1),
            nn.ReLU(),
            nn.MaxPool2d(kernel_size=3, stride=2)
        )
        self.fc = nn.Sequential(
            # 到这里需要使用dropout减少过拟合
            nn.Dropout(p=0.5),
            nn.Linear(6 * 6 * 256, 4096),
            nn.ReLU(),
            nn.Linear(4096, 4096),
            nn.ReLU(),
            nn.Linear(4096, num_classes)
        )

        # 如果设置了初始化权重，那么就调用对应方法
        if init_weights:
            self._initialize_weights()

    def forward(self, x):
        x = self.conv(x)
        # 进入全连接层前展平
        x = torch.flatten(x, start_dim=1)
        x = self.fc(x)

        return x

    # 权重初始化（KaiMing）
    def _initialize_weights(self):
        for m in self.modules():
            if isinstance(m, nn.Conv2d):
                nn.init.kaiming_normal_(m.weight, mode='fan_out', nonlinearity='relu')
                if m.bias is not None:
                    nn.init.constant_(m.bias, 0)
            elif isinstance(m, nn.Linear):
                nn.init.normal_(m.weight, 0, 0.01)
                nn.init.constant_(m.bias, 0)

三：VGG

# 给定字典选择模型
cfgs = 
    'vgg11': [64, 'M', 128, 'M', 256, 256, 'M', 512, 512, 'M', 512, 512, 'M'],
    'vgg13': [64, 64, 'M', 128, 128, 'M', 256, 256, 'M', 512, 512, 'M', 512, 512, 'M'],
    'vgg16': [64, 64, 'M', 128, 128, 'M', 256, 256, 256, 'M', 512, 512, 512, 'M', 512, 512, 512, 'M'],
    #'vgg16': [16, 16, 'M', 32, 32, 'M', 64, 64, 64, 'M', 128, 128, 128, 'M', 128, 128, 128, 'M'],
    'vgg19': [64, 64, 'M', 128, 128, 'M', 256, 256, 256, 256, 'M', 512, 512, 512, 512, 'M', 512, 512, 512, 512, 'M'],



# 生成卷积层
def create_conv(cfg):
    layers = []
    in_chaneels = parametes.init_in_chaneels

    # 遍历列表
    for c in cfg:
        # 如果遇到"M"，则增加一个最大池化层，其kernel_size=2, stride=2
        if c == 'M':
            layers += [nn.MaxPool2d(kernel_size=2, stride=2)]
        # 如果是数字，则代表该卷积核输出，卷积核统一为3×3，填充为1
        else:
            Conv2d = nn.Conv2d(in_channels=in_chaneels, out_channels=c, kernel_size=3, padding=1)
            layers += [Conv2d, nn.ReLU(True)]
            # 下一个输入通道等于现在的输出通道
            in_chaneels = c

    return nn.Sequential(*layers)


# VGG16网络
class VGG16(nn.Module):
    def __init__(self, conv, num_classes, init_weights=False):
        super(VGG16, self).__init__()
        self.conv = conv
        self.fc = nn.Sequential(
        	# 图片输入为224×224的前提下
            nn.Linear(512*7*7, 4096),
            nn.ReLU(True),
            nn.Dropout(p=0.5),
            nn.Linear(4096, 4096),
            nn.ReLU(True),
            nn.Dropout(p=0.5),
            nn.Linear(4096, num_classes)
        )
        if init_weights:
            self._initialize_weights()

    def forward(self, x):
        x = self.conv(x)
        x = torch.flatten(x, start_dim=1)
        x = self.fc(x)

        return x

    # 参数初始化（KAIMING）
    def _initialize_weights(self):
        for m in self.modules():
            if isinstance(m, nn.Conv2d):
                nn.init.kaiming_normal_(m.weight, mode='fan_out', nonlinearity='relu')
                if m.bias is not None:
                    nn.init.constant_(m.bias, 0)
            elif isinstance(m, nn.Linear):
                nn.init.normal_(m.weight, 0, 0.01)
                nn.init.constant_(m.bias, 0)

# 初始化网络
cfg = model.cfgs['vgg16']
net = model.VGG16(model.create_conv(cfg), parametes.num_classes, True)
net = net.to(parametes.device)

如下是VGG13，这种写法比较臃肿但清晰

import torch
import torch.nn as nn
import torch.nn.functional as F

class VGG13(nn.Module):
    def __init__(self):
        super(VGG13, self).__init__()

        # N * 3 * 32 * 32
        self.conv1_1 = nn.Sequential(
            nn.Conv2d(3, 64, kernel_size=3, padding=1),
            nn.BatchNorm2d(64),
            nn.ReLU()
        )
        self.conv1_2 = nn.Sequential(
            nn.Conv2d(64, 64, kernel_size=3, padding=1),
            nn.BatchNorm2d(64),
            nn.ReLU()
        )
        self.max_pooling1 = nn.MaxPool2d(kernel_size=2, stride=2)

        # N * 64 * 16 * 16
        self.conv2_1 = nn.Sequential(
            nn.Conv2d(64, 128, kernel_size=3, padding=1),
            nn.BatchNorm2d(128),
            nn.ReLU()
        )
        self.conv2_2 = nn.Sequential(
            nn.Conv2d(128, 128, kernel_size=3, padding=1),
            nn.BatchNorm2d(128),
            nn.ReLU()
        )
        self.max_pooling2 = nn.MaxPool2d(kernel_size=2, stride=2)

        # N * 128 * 8 * 8
        self.conv3_1 = nn.Sequential(
            nn.Conv2d(128, 256, kernel_size=3, padding=1),
            nn.BatchNorm2d(256),
            nn.ReLU()
        )
        self.conv3_2 = nn.Sequential(
            nn.Conv2d(256, 256, kernel_size=3, padding=1),
            nn.BatchNorm2d(256),
            nn.ReLU()
        )
        self.max_pooling3 = nn.MaxPool2d(kernel_size=2, stride=2)

        # N * 256 * 4 * 4
        self.conv4_1 = nn.Sequential(
            nn.Conv2d(256, 512, kernel_size=3, padding=1),
            nn.BatchNorm2d(512),
            nn.ReLU()
        )
        self.conv4_2 = nn.Sequential(
            nn.Conv2d(512, 512, kernel_size=3, padding=1),
            nn.BatchNorm2d(512),
            nn.ReLU()
        )
        self.max_pooling4 = nn.MaxPool2d(kernel_size=2, stride=2)

        # N * 512 * 2 * 2
        self.conv5_1 = nn.Sequential(
            nn.Conv2d(512, 512, kernel_size=3, padding=1),
            nn.BatchNorm2d(512),
            nn.ReLU()
        )
        self.conv5_2 = nn.Sequential(
            nn.Conv2d(512, 512, kernel_size=3, padding=1),
            nn.BatchNorm2d(512),
            nn.ReLU()
        )
        self.max_pooling5 = nn.MaxPool2d(kernel_size=2, stride=2)

        # N * 512 * 1 * 1

        # 全连接层
        self.fc = nn.Sequential(
            nn.Linear(512 * 1 * 1, 4096),
            nn.ReLU(True),
            nn.Dropout(p=0.5),
            nn.Linear(4096, 4096),
            nn.ReLU(True),
            nn.Dropout(p=0.5),
            nn.Linear(4096, 10)
        )

    def forward(self, x):
        out = self.conv1_1(x)
        out = self.conv1_2(out)
        out = self.max_pooling1(out)

        out = self.conv2_1(out)
        out = self.conv2_2(out)
        out = self.max_pooling2(out)

        out = self.conv3_1(out)
        out = self.conv3_2(out)
        out = self.max_pooling3(out)

        out = self.conv4_1(out)
        out = self.conv4_2(out)
        out = self.max_pooling4(out)

        out = self.conv5_1(out)
        out = self.conv5_2(out)
        out = self.max_pooling5(out)

        out = torch.flatten(out, start_dim=1)

        out = self.fc(out)
        return out

四：ResNet

import torch
import torch.nn as nn
import torch.nn.functional as F

# 基本跳连单元
class ResBlock(nn.Module):
    def __init__(self, in_channel, out_channel, stride=1):
        super（机器学习深度学习常用库框架|pytorch篇）第一节：pytorch简介和其核心概念(代码片段)
文章目录一：什么是Pytorch二：Pytorch优势三：Pytorch三大核心概念（1）tensor（张量）（2）autograd（自动微分-变量）（3）nn.Module（神经网络）四：tensor和机器学习、深度...  查看详情  
                
（机器学习深度学习常用库框架|pytorch篇）第三节：pytorch之torchvision详解(代码片段)
...hvision.models一：torchvision概述torchvision：torchvision是Pytorch的一个图形库，主要用来构建计算机视觉模型，torchvision由以下四个部分构成torchvision.datasets：包括一些加载数据的函数和常用的数据集接口torchvision.models&...  查看详情  
                
深度学习-pytorch框架实战系列
深度学习-PyTorch框架实战系列PyTorch是一个开源的Python机器学习库，基于Torch，用于自然语言处理等应用程序。2017年1月，由Facebook人工智能研究院（FAIR）基于Torch推出了PyTorch。它是一个基于Python的可续计算包，提供两个高级功能...  查看详情  
                
1.pytorch是什么？(代码片段)
这篇博客将介绍PyTorch深度学习库，包括：PyTorch是什么如何安装PyTorch重要的PyTorch功能，包括张量和自动标记PyTorch如何支持GPU为什么PyTorch在研究人员中如此受欢迎PyTorch是否优于Keras/TensorFlow是否应该在项目中使用PyTorch...  查看详情  
                
3.使用pytorch深度学习库训练第一个卷积神经网络cnn(代码片段)
这篇博客将介绍如何使用PyTorch深度学习库训练第一个卷积神经网络（CNN）。训练CNN使用KMNIST数据集（MNISTdigits数据集的替代品，内置在PyTorch中）识别手写平假名字符（handwrittenHiraganacharacters）。在图像...  查看详情  
                
ai常用框架和工具丨12.深度学习框架pytorch
深度学习框架PyTorch，AI常用框架和工具之一。理论知识结合代码实例，希望对您有所帮助。文章目录环境说明PyTorch安装一、PyTorch简介1.1Torch1.2从Torch到PyTorch1.3PyTorch二、PyTorch中张量操作2.1torch2.2张量的常见操作2.3张量的其他操作...  查看详情  
                
ai人工智能机器学习深度学习学习路径及推荐书籍
要学习Pytorch，需要掌握以下基本知识：编程语言：Pytorch使用Python作为主要编程语言，因此需要熟悉Python编程语言。线性代数和微积分：Pytorch主要用于深度学习领域，深度学习是基于线性代数和微积分的，因此需要具备线性代数...  查看详情  
                
嵌入式学深度学习：1pytorch框架搭建(代码片段)
嵌入式学深度学习：1、Pytorch框架搭建1、介绍2、Pytorch开发环境搭建2.1、查看GPU是否支持CUDA2.2、安装Miniconda2.3、使用Conda安装pytorch2.4、安装常用库3、简单使用验证1、介绍深度学习是机器学习的一种，如下图：目前深...  查看详情  
                
《深度学习与计算机视觉算法原理框架应用》pdf+《深度学习之pytorch实战计算机视觉》pdf
...下载：https://pan.baidu.com/s/1P0-o29x0ZrXp8WotN7GzcA《深度学习之PyTorch实战计算机视觉》更多分享：https://pan.baidu.com/s/1g4hv05UZ_w92uh9NNNkCaA《深度学习与计算机视觉算法原理框架应用》共13章，分为2篇。第1篇基础知识，介绍了人工智能发展...  查看详情  
                
pytorchpytorch基础第0章(代码片段)
本文参加新星计划人工智能(Pytorch)赛道：https://bbs.csdn.net/topics/613989052这是目录PyTorch的简介PyTorch构建深度学习模型的步骤搭建pytorch使用环境PyTorch的简介PyTorch是一个开源的机器学习框架，由Facebook的人工智能研究院（F...  查看详情  
                
从tensorflow到pytorch：九大深度学习框架哪款最适合你？
开源的深度学习神经网络正步入成熟，而现在有许多框架具备为个性化方案提供先进的机器学习和人工智能的能力。那么如何决定哪个开源框架最适合你呢？本文试图通过对比深度学习各大框架的优缺点，从而为各位读者提供一...  查看详情  
                
tensorfloworpytorch
...比较突出，他们是两个最流行的深度学习库：TensorFlow和PyTorch。你没有办法指出这两个库有什么本质的不同，不用担心！我将在这网络上无休止的存储空间中添加一篇新的文章，也许可以帮你弄清楚一些问题。我将简要的快速的...  查看详情  
                
csdn独家|全网首发|pytorch深度学习·理论篇(2023版)目录
很高兴和大家在这里分享我的最新专栏 Pytorch深度学习·理论篇(2023版)，恭喜本博客浏览量达到两百万，CSDN内容合伙人，CSDN人工智能领域实力新星~0Pytorch深度学习·理论篇+实战篇(2023版)大纲1Pytorch深度学习·理论篇...  查看详情  
                
人工智能学习
...二阶段：编程python工具库实战／python网络爬虫第三阶段：机器学习机器学习入门／机器学习提升第四阶段：数据挖掘实战数据挖掘入门／数据分析实战第五阶段：深度学习深度学习网络与框架／深度学习项目实战 https://blog.cs...  查看详情  
                
pytorch是啥？
PyTorch是一个开源的Python机器学习库，基于Torch，用于自然语言处理等应用程序。由Facebook人工智能研究院（FAIR）基于Torch推出了PyTorch。它是一个基于Python的可续计算包，提供两个高级功能：具有强大的GPU加速的张量计算（如NumPy...  查看详情  
                
深度学习－机器视觉学习路线
...ＡＳＫ－ＦａｓｔｅｒＲＣＮＮ２、平台Ｔensorflow\Caffe\Pytorch3、分析工具ｐｙｔｈｏｎ及相应的依赖库　ｎｕｍｐｙ　ｐａｎｄａｓ　ｍａｔｐｌｏｔｌｉｂ　ｓｃｉｐｙ４、前沿知识关注ＧＡＮ、迁移学习等５、开源数据集应...  查看详情  
                
想学深度学习开发，需要提前掌握哪些python知识？
...是大数据竞赛的热门)，下面转战深度学习：现在推荐用pytorch，今年的顶会pytorch占了半壁江山，这个比tensorflow，keras简单易懂，而且功能强大，pytorch的库叫做torch，和torchvision同时服用效果更加（还可以加torchnet等一些其他模块...  查看详情  
                
人工智能领域常用的开源框架和库（含机器学习/深度学习/强化学习/知识图谱/图神经网络）
...hon编程语言的开源框架和库，因此全面性肯定有限！一、机器学习常用的开源框架和库1.Scikit-learn作为专门面向机器学习的Python开源框架，Scikit-learn内部实现了多种机器学习算法，容易安装和使用  查看详情