深度学习-计算机视觉-基础学习笔记-02

weixin_43739821 weixin_43739821     2022-12-04     282

关键词:

卷积神经网络
Convolutional Neural Networks—CNN,其与常规神经网络的构想基本一致,不同的是需要训练卷积层,因为其更能保留输入的空间结构。
前面我们提到了全连接层的概念,将一个32323的照片像素提取并展开,得到一个3072维的向量,将其与10*3072的权值矩阵相乘得到激活值。

至于卷积层和全连接层的主要区别在于卷积层可以保全空间结构,比如上面中的图片不再将它展开成长向量,保持图片的结构,我们的权重W转为一些小的卷积核,将其在整个图像上滑动计算每一个空间定位时的点积结果,也就是将卷积核每个位置元素和与之对应图像区域的像素值相乘再加上偏置项。在做点积运算时我们会将这个553的块及对应的输入数据快转开成一个向量,将对应的每个空间位置元素进行相乘然后相加。



我们如何滑动卷积核并遍历所有空间位置呢,将这个卷积核从左上方的边角处开始,并且让其遍历输入的所有像素点,每一次点积运算都会在我们输出激活映射中产生一个值之后继续滑动卷积核,最简单的方式是一个个像素地滑动并相应的填满我们的输出激活映射或者其它滑动方式,比如每次滑动俩个像素点这样得到的是不同尺寸大小的输出。

当我们在处理一个卷积层时往往希望用到多种卷积核,因为每一种卷积核都可以从输入中得到一种特殊的模式或者概念,如果说我们有六个卷积核每个尺寸都是553,这样我们就会得到一个6层的尺寸大小是28286(每一个的尺寸是28281)的激活映射。

卷积神经网络基本上是由多个卷积层组成的一个序列,一个图片在输入之后输出最终结果之前的这些中间结果就是卷积层,它们依次堆叠,就像之前在神经网络中那样堆叠简单的线性层一样,之后我们将会用激活函数对其逐一处理,得到一些ReLU、Conv和池化层等东西,之后得到一系列的这些层,每一个都有一个输出,该输出又作为下一个卷积层的输入。

这些层采用多个卷积核,每一个卷积核会产生一个激活映射,最后的结果是你完成了对这组卷积核的学习,前面的卷积核一般代表了一些低阶的图像特征比如边缘特征,而对于中间层你可以得到一些更加复杂的图像特征比如边角和斑点等,对于那些高级特征你可以获得一些比斑点更加丰富的内容。

深度学习-计算机视觉-基础学习笔记-03

更好的优化方法前面提到的随机梯度下降(SGD)在实际使用中会产生很多问题,比如下图中的损失函数对水平方向不敏感而对竖直方向敏感的情况,实际在更高维涉及到非常多的参数时这个问题更明显。其另一个问题是局部... 查看详情

深度学习-计算机视觉-基础学习笔记-01(代码片段)

图像分类的思想:收集大量已知图像数据并带有正确的标签,将以往通过一个函数传入一张图片并返回图片的类型的这个思想转变成,通过俩个函数,第一个函数传入大量的图片并通过该函数训练返回一个模型,该... 查看详情

深度学习-计算机视觉-基础学习笔记-02(代码片段)

卷积神经网络ConvolutionalNeuralNetworks—CNN,其与常规神经网络的构想基本一致,不同的是需要训练卷积层,因为其更能保留输入的空间结构。前面我们提到了全连接层的概念,将一个32×32×3的照片像素提取并展开... 查看详情

深度学习·理论篇(2023版)·第003篇深度学习和计算机视觉中的基础数学知识02:特征向量和特征值+矩阵乘法的几何意义+奇异值分解+线性可分性和维度+非线性变换

查看详情

《深度学习与计算机视觉算法原理框架应用》pdf+《深度学习之pytorch实战计算机视觉》pdf

下载:https://pan.baidu.com/s/12-s95JrHek82tLRk3UQO_w《深度学习与计算机视觉算法原理、框架应用》PDF,带书签,347页。《大数据架构详解:从数据获取到深度学习》PDF,带书签,373页。配套源代码。下载:https://pan.baidu.com/s/1P0-o29x0ZrXp8Wo... 查看详情

计算机视觉与深度学习笔记ep1

主要资料来源:(P1-P3)计算机视觉与深度学习北京邮电大学鲁鹏清晰版合集(完整版)_哔哩哔哩_bilibili数据驱动的图像分类方法          数据集收集数据集划分与预处理        训练集:确定超... 查看详情

计算机视觉+人工智能面试笔试总结——深度学习基础

目录1.欧氏距离2.余弦相似度3.余弦相似度和欧氏距离的区别4.容量、欠拟合和过拟合< 查看详情

计算机视觉+人工智能面试笔试总结——深度学习基础题1~20

目录1.介绍一下NMS和IOU的原理2.交叉验证的理解3.验证集和测试集的作用 查看详情

计算机视觉+人工智能面试笔试总结——深度学习基础题21~40

目录21.如何选择dropout的概率22.dropout在神经网络中的应用23.dropout具体工作流程24.什么是dropout? 查看详情

计算机视觉+人工智能面试笔试总结——深度学习基础题41~51

目录41.CNN结构特点42.CNN权值共享问题43.卷积层与全连接层的区别44.卷积和池化操作的作用 查看详情

深度学习-计算机视觉-基础学习笔记-03

更好的优化方法前面提到的随机梯度下降(SGD)在实际使用中会产生很多问题,比如下图中的损失函数对水平方向不敏感而对竖直方向敏感的情况,实际在更高维涉及到非常多的参数时这个问题更明显。其另一个问题是局部... 查看详情

深度学习-计算机视觉-基础学习笔记-01(代码片段)

图像分类的思想:收集大量已知图像数据并带有正确的标签,将以往通过一个函数传入一张图片并返回图片的类型的这个思想转变成,通过俩个函数,第一个函数传入大量的图片并通过该函数训练返回一个模型,该... 查看详情

斯坦福cs231n—深度学习与计算机视觉----学习笔记课时6

课时6线性分类器损失函数与最优化(上)多类SVM损失:这是一个两分类支持向量机的泛化SVM损失计算了所有不正确的例子,将所有不正确的类别的评分,与正确类别的评分之差加1,将得到的数值与0作比较,取两者中的最大值。... 查看详情

斯坦福cs231n—深度学习与计算机视觉----学习笔记课时24&&25

课时24深度学习开源库使用介绍(上)Caffe被用于重新实现AlexNet,然后用AlexNet的特征来解决其他事情用C++书写的,可以去GitHub上面读取源代码主要四个类:Blob可以存你的权重,像素值,激活等,是n维的张量,就像NumPy一样,他... 查看详情

斯坦福cs231n—深度学习与计算机视觉----学习笔记课时14&&15

课时14卷积神经网络详解(上)CNN处理的是一些数据块,在这之间有很多层,一系列的层将输入数据变换为输出数据,所以完成操作的中间量不仅是NN时候讲的那些向量,而是立体结构,有宽,高和深度,在整个计算过程中要保... 查看详情

学习笔记计算机视觉与深度学习(3.卷积与图像去噪/边缘提取/纹理表示)

学习视频:鲁鹏-计算机视觉与深度学习同系列往期笔记:【学习笔记】计算机视觉与深度学习(1.线性分类器)【学习笔记】计算机视觉与深度学习(2.全连接神经网络)1卷积噪声点:该点的像素和周围像素点的差异很大&#... 查看详情

深度学习基础:8.卷积与池化(代码片段)

从本篇开始,将进入到深度学习的计算机视觉领域,在此之前有必要对传统图像处理方法做个回顾。传统图像处理在我的【计算机视觉】基础图像知识点整理和【计算机视觉】数字图像处理基础知识题这两篇博文中,... 查看详情

斯坦福cs231n—深度学习与计算机视觉----学习笔记课时12&&13

课时12神经网络训练细节part2(上)训练神经网络是由四步过程组成,你有一个完整的数据集图像和标签,从数据集中取出一小批样本,我们通过网络做前向传播得到损失,告诉我们目前分类效果怎么样。然后我们反向传播来得... 查看详情