关键词:
文章目录
1. 数据
通常,当您必须处理图像,文本,音频或视频数据时,可以使用将数据加载到 NumPy 数组中的标准 Python 包。 然后,您可以将该数组转换为torch.*Tensor。
- 对于图像,Pillow,OpenCV 等包很有用
- 对于音频,请使用 SciPy 和 librosa 等包
- 对于文本,基于 Python 或 Cython 的原始加载,或者 NLTK 和 SpaCy 很有用
专门针对视觉,我们创建了一个名为torchvision的包,其中包含用于常见数据集(例如 Imagenet,CIFAR10,MNIST 等)的数据加载器,以及用于图像(即torchvision.datasets和torch.utils.data.DataLoader)的数据转换器。
在本教程中,我们将使用 CIFAR10 数据集。 它具有以下类别:“飞机”,“汽车”,“鸟”,“猫”,“鹿”,“狗”,“青蛙”,“马”,“船”,“卡车”。 CIFAR-10 中的图像尺寸为3x32x32,即尺寸为32x32像素的 3 通道彩色图像
。
2. 训练图像分类器
我们将按顺序执行以下步骤:
- 使用torchvision加载并标准化 CIFAR10 训练和测试数据集
- 定义卷积神经网络
- 定义损失函数
- 根据训练数据训练网络
- 在测试数据上测试网络
下面分步骤介绍
2. 1 加载并标准化 CIFAR10
TorchVision 数据集的输出是[0, 1]范围的PILImage图像。 我们将它们转换为归一化范围[-1, 1]的张量。
import torch
import torchvision
import torchvision.transforms as transforms
transform = transforms.Compose(
[transforms.ToTensor(),
transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))])
# 下载数据集
trainset = torchvision.datasets.CIFAR10(root='./data', train=True,
download=True, transform=transform)
# 加载数据集
trainloader = torch.utils.data.DataLoader(trainset, batch_size=4,
shuffle=True, num_workers=2)
testset = torchvision.datasets.CIFAR10(root='./data', train=False,
download=True, transform=transform)
testloader = torch.utils.data.DataLoader(testset, batch_size=4,
shuffle=False, num_workers=2)
classes = ('plane', 'car', 'bird', 'cat',
'deer', 'dog', 'frog', 'horse', 'ship', 'truck')
输出:
Downloading https://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gz to ./data/cifar-10-python.tar.gz
170499072it [22:13, 127813.17it/s]
Extracting ./data/cifar-10-python.tar.gz to ./data
Files already downloaded and verified
会在当前文件下生成data文件夹,并且里面有下载的cifar-10-batches-py数据。
2.2 训练图像
import matplotlib.pyplot as plt
import numpy as np
# functions to show an image
def imshow(img):
img = img / 2 + 0.5 # unnormalize
npimg = img.numpy()
plt.imshow(np.transpose(npimg, (1, 2, 0)))
plt.show()
# get some random training images
dataiter = iter(trainloader)
images, labels = dataiter.next()
# show images
imshow(torchvision.utils.make_grid(images))
# print labels
print(' '.join('%5s' % classes[labels[j]] for j in range(4)))
输出:
cat frog deer truck
3. 定义卷积神经网络、损失函数、优化器、训练网络和保存模型
下列步骤分别为:
- 加载并标准化CIFAR10
- 定义神经网络(上一章自定义)
- 定义损失函数和优化器
- 训练网络
- 保存训练过的模型
# 1. 加载并标准化CIFAR10
import torch
import torchvision
import torchvision.transforms as transforms
transform = transforms.Compose(
[transforms.ToTensor(),
transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))])
trainset = torchvision.datasets.CIFAR10(root='./data', train=True,
download=True, transform=transform)
trainloader = torch.utils.data.DataLoader(trainset, batch_size=4,
shuffle=True, num_workers=2)
testset = torchvision.datasets.CIFAR10(root='./data', train=False,
download=True, transform=transform)
testloader = torch.utils.data.DataLoader(testset, batch_size=4,
shuffle=False, num_workers=2)
classes = ('plane', 'car', 'bird', 'cat',
'deer', 'dog', 'frog', 'horse', 'ship', 'truck')
# 2. 定义神经网络
import torch.nn as nn
import torch.nn.functional as F
class Net(nn.Module):
def __init__(self):
super(Net, self).__init__()
self.conv1 = nn.Conv2d(3, 6, 5)
self.pool = nn.MaxPool2d(2, 2)
self.conv2 = nn.Conv2d(6, 16, 5)
self.fc1 = nn.Linear(16 * 5 * 5, 120)
self.fc2 = nn.Linear(120, 84)
self.fc3 = nn.Linear(84, 10)
def forward(self, x):
x = self.pool(F.relu(self.conv1(x)))
x = self.pool(F.relu(self.conv2(x)))
x = x.view(-1, 16 * 5 * 5)
x = F.relu(self.fc1(x))
x = F.relu(self.fc2(x))
x = self.fc3(x)
return x
net = Net()
# 3. 定义损失函数和优化器
import torch.optim as optim
criterion = nn.CrossEntropyLoss()
optimizer = optim.SGD(net.parameters(), lr=0.001, momentum=0.9)
# 4. 训练网路
for epoch in range(2): # loop over the dataset multiple times
running_loss = 0.0
for i, data in enumerate(trainloader, 0):
# get the inputs; data is a list of [inputs, labels]
inputs, labels = data
# zero the parameter gradients
optimizer.zero_grad()
# forward + backward + optimize
outputs = net(inputs)
loss = criterion(outputs, labels)
loss.backward()
optimizer.step()
# print statistics
running_loss += loss.item()
if i % 2000 == 1999: # print every 2000 mini-batches
print('[%d, %5d] loss: %.3f' %
(epoch + 1, i + 1, running_loss / 2000))
running_loss = 0.0
print('Finished Training')
# 4. 保存训练的模型
PATH = './cifar_net.pth'
torch.save(net.state_dict(), PATH)
输出:
[1, 2000] loss: 2.234
[1, 4000] loss: 1.920
[1, 6000] loss: 1.699
[1, 8000] loss: 1.623
[1, 10000] loss: 1.535
[1, 12000] loss: 1.496
[2, 2000] loss: 1.408
[2, 4000] loss: 1.376
[2, 6000] loss: 1.342
[2, 8000] loss: 1.340
[2, 10000] loss: 1.281
[2, 12000] loss: 1.285
Finished Training
在当前目标下,会生成cifar_net.pth
的训练模型。
4. 测试自己的模型
我们已经在训练数据集中对网络进行了 2 次训练。 但是我们需要检查网络是否学到了什么。我们将通过预测神经网络输出的类别标签并根据实际情况进行检查来进行检查。 如果预测正确,则将样本添加到正确预测列表中。
下列步骤以此为:
- 加载并标准化CIFAR10
- 显示测试集中的图像以使其熟悉
- 加载模型
- 输出10 类的能量。
# 1. 加载并标准化CIFAR10
import torch
import torchvision
import torchvision.transforms as transforms
transform = transforms.Compose(
[transforms.ToTensor(),
transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))])
trainset = torchvision.datasets.CIFAR10(root='./data', train=True,
download=True, transform=transform)
trainloader = torch.utils.data.DataLoader(trainset, batch_size=4,
shuffle=True, num_workers=2)
testset = torchvision.datasets.CIFAR10(root='./data', train=False,
download=True, transform=transform)
testloader = torch.utils.data.DataLoader(testset, batch_size=4,
shuffle=False, num_workers=2)
classes = ('plane', 'car', 'bird', 'cat',
'deer', 'dog', 'frog', 'horse', 'ship', 'truck')
# 2. 显示测试集中的图像以使其熟悉
import matplotlib.pyplot as plt
import numpy as np
# functions to show an image
def imshow(img):
img = img / 2 + 0.5 # unnormalize
npimg = img.numpy()
plt.imshow(np.transpose(npimg, (1, 2, 0)))
plt.show()
dataiter = iter(testloader)
images, labels = dataiter.next()
# print images
imshow(torchvision.utils.make_grid(images))
print('GroundTruth: ', ' '.join('%5s' % classes[labels[j]] for j in range(4)))
# 3. 加载模型
import torch.nn as nn
import torch.nn.functional as F
class Net(nn.Module):
def __init__(self):
super(Net, self).__init__()
self.conv1 = nn.Conv2d(3, 6, 5)
self.pool = nn.MaxPool2d(2, 2)
self.conv2 = nn.Conv2d(6, 16, 5)
self.fc1 = nn.Linear(16 * 5 * 5, 120)
self.fc2 = nn.Linear(120, 84)
self.fc3 = nn.Linear(84, 10)
def forward(self, x):
x = self.pool(F.relu(self.conv1(x)))
x = self.pool(F.relu(self.conv2(x)))
x = x.view(-1, 16 * 5 * 5)
x = F.relu(self.fc1(x))
x = F.relu(self.fc2(x))
x = self.fc3(x)
return x
net = Net()
PATH = './cifar_net.pth'
net.load_state_dict(torch.load(PATH))
# 4. 输出10 类的能量。
outputs = net(images)
print(outputs)
输出为:
GroundTruth: cat ship ship plane
tensor([[-1.1036, -1.1703, 0.1451, 2.0333, -0.7547, 1.0753, 2.0552, -1.2556,
-0.7143, -0.8021],
[ 4.6933, 6.5281, -0.7193, -3.1148, -1.8851, -3.8340, -3.7057, -4.3794,
6.2864, 3.4431],
[ 2.9412, 3.4974, -0.8135, -1.6855, -0.9687, -2.5153, -3.1499, -2.1516,
3.8812, 2.0316],
[ 3.4499, 2.1135, -0.1122, -1.5846, 0.2921, -2.5501, -2.5868, -0.8204,
2.3701, 1.0973]], grad_fn=<AddmmBackward>)
Predicted: frog car ship plane
让我们看一下网络在整个数据集上的表现。
correct = 0
total = 0
with torch.no_grad():
for data in testloader:
images, labels = data
outputs = net(images)
_, predicted = torch.max(outputs.data, 1)
total += labels.size(0)
correct += (predicted == labels).sum().item()
print('Accuracy of the network on the 10000 test images: %d %%' % (
100 * correct / total))
输出:
Accuracy of the network on the 10000 test images: 53 %
可以看出,53%高于盲猜的10%,所以该网络有一定的学习效率。
来看看哪一类的表现更好:
class_correct = list(0. for i in range(10))
class_total = list(0. for i in range(10))
with torch.no_grad():
for data in testloader:
images, labels = data
outputs = net(images)
_, predicted = torch.max(outputs, 1)
c = (predicted == labels).squeeze()
for i in range(4):
label = labels[i]
class_correct[label] += c[i].item()
class_total[label] += 1
for i in range(10):
print('Accuracy of %5s : %2d %%' % (
classes[i], 100 * class_correct[i] / class_total[i]))
输出:
Accuracy of plane : 61 %
Accuracy of car : 83 %
Accuracy of bird : 17 %
Accuracy of cat : 21 %
Accuracy of deer : 50 %
Accuracy of dog : 47 %
Accuracy of frog : 67 %
Accuracy of horse : 78 %
Accuracy of ship : 56 %
Accuracy of truck : 49 %
可以看出car的表现更佳。
5. 在GPU上进行训练
就像将张量转移到 GPU 上一样,您也将神经网络转移到 GPU 上。
如果可以使用 CUDA,首先将我们的设备定义为第一个可见的 cuda 设备:
device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
# Assuming that we are on a CUDA machine, this should print a CUDA device:
print(device)
然后,这些方法将递归遍历所有模块,并将其参数和缓
pytorch深度学习50篇·······第五篇:yolo-----训练篇(代码片段)
一周过去了,我赶在一周的尾巴上来继续写文章了,上周不算忙,至少不用去驻场了,日子好过多了。不过苦了小兄弟们了,他们去驻场了。来这个现在这个公司快两年了,大概是今年5月份开始,我们... 查看详情
pytorch学习-训练cifar10分类器(代码片段)
output_10_1.pngTRAININGACLASSIFIER参考PytorchTutorial:DeepLearningwithPyTorch:A60MinuteBlitz在学会了以下后:定义神经网络计算损失函数更新权重WhataboutdataGenerally,whenyouhavetodealwithimage,text,audioorvideodata,youcanusestandardpythonpackagesthatloaddataintoanumpyarray.The... 查看详情
pytorch应用:构建分类器(代码片段)
Pytorch应用:构建分类器学习目标1.分类器任务和数据介绍2.训练分类器的步骤2.1使用torchvision下载CIFAR10数据集2.2定义卷积神经网络2.3定义损失函数2.4在训练集上训练模型2.5保存模型3.在测试集上测试模型3.1展示测试集中的若干... 查看详情
pytorch学习笔记7.textcnn文本分类(代码片段)
PyTorch学习笔记7.TextCNN文本分类一、模型结构二、文本分词与编码1.分词与编码器2.数据加载器二、模型定义1.卷积层2.池化层3.全连接层三、训练过程四、测试过程五、预测过程一、模型结构2014年,YoonKim针对CNN的输入层做了一... 查看详情
pytorch学习笔记7.textcnn文本分类(代码片段)
PyTorch学习笔记7.TextCNN文本分类一、模型结构二、文本分词与编码1.分词与编码器2.数据加载器二、模型定义1.卷积层2.池化层3.全连接层三、训练过程四、测试过程五、预测过程一、模型结构2014年,YoonKim针对CNN的输入层做了一... 查看详情
学习笔记《pytorch入门》完整的模型训练套路(cifar10model)(代码片段)
文章目录准备数据集(训练和测试)搭建神经网络创建损失函数,分类问题使用交叉熵创建优化器设置训练网络的一些参数进入训练循环准备进入测试步骤完整代码:准备数据集(训练和测试)训练数据集... 查看详情
pytorch学习笔记8.实现线性回归模型
PyTorch学习笔记8.实现线性回归模型一、回归的概念1.概念2.目标3.应用4.训练线性回归的步骤二、数据集1.构造数据集2.把数据集转为pytorch使用的张量三、模型1.模型定义2.损失函数3.优化器四、使用模型1.训练2.测试3.预测4.可视化五... 查看详情
《python深度学习》第五章-3(预训练)读书笔记(代码片段)
5.3 使用预训练的卷积神经网络预训练网络(pretrainednetwork):是一个之前已在大型数据集(通常是大规模图像分类任务)上训练好、保存好的网络\\colorred训练好、保存好的网络训练好、保存好的网络。预训... 查看详情
[深度学习]pytorch学习——torch.nn实践:训练分类器(含多gpu训练cpu加载预测的使用方法)(代码片段)
LearnFrom:Pytroch官方TutorialsPytorch官方文档环境:python3.6CUDA10pytorch1.3vscode+jupyter扩展#%%#%%#1.LoadingandnormalizingCIFAR10importtorchimporttorchvisionimporttorchvision.transformsastransformsbatch_size=16transform=transforms.Compose([transforms.ToTensor(),transforms.Normalize((0.5... 查看详情
第五篇:朴素贝叶斯分类算法原理分析与代码实现
前言 本文介绍机器学习分类算法中的朴素贝叶斯分类算法并给出伪代码,Python代码实现。词向量 朴素贝叶斯分类算法常常用于文档的分类,而且实践证明效果挺不错的。 ... 查看详情
pytorch学习笔记:pytorch进阶训练技巧(代码片段)
PyTorch实战:PyTorch进阶训练技巧往期学习资料推荐:1.Pytorch实战笔记_GoAI的博客-CSDN博客2.Pytorch入门教程_GoAI的博客-CSDN博客本系列目录:PyTorch学习笔记(一):PyTorch环境安装PyTorch学习笔记(二)... 查看详情
pytorch学习笔记3.数据集和数据加载器(代码片段)
PyTorch学习笔记3.数据集和数据加载器一、说明二、使用PyTorch预置数据集1.预置数据集FashionMNIST介绍2.加载数据集3.对数据集处理和可视化三、自定义数据集1.要实现的方法2.定义3.`__init__`4.`__len`5.`__getitem__`6.准备... 查看详情
pytorch深度学习50篇·······第五篇:yolo-----yolov3v4v5的模型结构(代码片段)
第四篇,我们已经简单的过了一个segmentation网络,下面我们要进入一个相对要复杂一点的系列了,它也是用于目标检测的,与segmentation不同的是,这个网络会回归出目标的位置和大小。YOLO的全程是YouOnlyLookOnce&... 查看详情
使用pytorch训练一个图像分类器(代码片段)
原文:TRAININGACLASSIFIER翻译:Jerry日期:2019-01-23importtorchimporttorchvisionimporttorchvision.transformsastransformsimportmatplotlib.pyplotaspltimportnumpyasnpprint("torch:%s"%torch.__version__)pri 查看详情
pytorch迁移学习教程(计算机视觉应用实例)(代码片段)
文章目录迁移学习什么是迁移学习为何用迁移学习迁移学习的优点迁移学习的方法迁移方法的选择学习目标下载数据导入模块数据增强制作数据集数据加载器相关信息的打印训练数据可视化训练模型参数微调的方法特征提取的方... 查看详情
r学习笔记第五篇:数据变换和清理
在使用R的分组操作之前,首先要了解R语言包,包实质上是实现特定功能的,预先写好的代码库(library),R拥有大量的软件包,许多包都是由某一领域的专家编写的,但并不是所有的包都有很高的质量的,在使用包之前,最好... 查看详情
pytorch笔记-imdb数据集文本分类项目模型与训练(代码片段)
IMDB数据集:Kaggle下载地址,影评的积极或消极分类的影评PyTorch的Dataset:torchtext.datasets.IMDB#pipinstalltorchdatatorchtext#版本号需要与PyTorch对齐fromtorchtext.datasetsimportIMDBIMDB文本分类,自定义网络:im 查看详情
pytorch学习笔记8.实现线性回归模型(代码片段)
PyTorch学习笔记8.实现线性回归模型一、回归的概念1.概念2.目标3.应用4.训练线性回归的步骤二、数据集1.构造数据集2.把数据集转为pytorch使用的张量三、模型1.模型定义2.损失函数3.优化器四、使用模型1.训练2.测试3.预测4.可视化五... 查看详情