计算机视觉与深度学习线性分类器

CCH²¹ CCH²¹     2022-12-25     590

关键词:

从线性分类器开始

  • 线性分类器形式简单,易于理解。
  • 通过层级结构(神经网络)或高维映射(支持向量机)可以形成功能强大的非线性模型。

线性分类器的定义

线性分类器是一种线性映射,将输入的图像特征映射为类别分数。线性分类器定义如下: f i ( x , w i ) = w i T x + b i , i = 1 , 2 , . . . , c f_i(\\bm x, \\bm w_i)=\\bm w_i^T \\bm x+b_i,i=1,2,...,c fi(x,wi)=wiTx+bi,i=1,2,...,c其中 x \\bm x x代表输入的 d d d维图像向量, c c c为类别个数, w i = [ w i 1 w i 2 . . . w i d ] T \\bm w_i=\\begingathered\\beginbmatrix w_i1 & w_i2 & ... & w_id \\endbmatrix\\endgathered^T wi=[wi1wi2...wid]T为第 i i i个类别的权值向量, b i b_i bi为偏置。如果 f i ( x ) > f j ( x ) f_i(\\bm x)>f_j(\\bm x) fi(x)>fj(x),则决策输入图像 x \\bm x x属于第 i i i类。

线性分类器的决策步骤

  1. 将图像表示为向量。
    假设我们有一张图片 [ 56 231 24 2 ] \\begingathered\\beginbmatrix 56 & 231 \\\\ 24 & 2 \\endbmatrix\\endgathered [56242312]将其转换为向量的形式即为 x = [ 56 231 24 2 ] \\bm x=\\begingathered\\beginbmatrix 56 \\\\ 231 \\\\ 24 \\\\ 2 \\endbmatrix\\endgathered x=56231242
  2. 计算当前图片每个类别的分数。
    假设我们当前需要完成的是一个三分类任务(将图片划分为汽车类、猫类、鸟类的其中一种),线性分类器为 f i ( x , w i ) = w i T x + b i , i = 1 , 2 , 3 f_i(\\bm x, \\bm w_i)=\\bm w_i^T \\bm x+b_i,i=1,2,3 fi(x,wi)=wiTx+bi,i=1,2,3其中权值矩阵 w i T = [ 0.2 − 0.5 0.1 2.0 1.5 1.3 2.1 0.0 0 0.25 0.25 − 0.3 ] \\bm w_i^T=\\begingathered\\beginbmatrix 0.2 & -0.5 & 0.1 & 2.0 \\\\ 1.5 & 1.3 & 2.1 & 0.0 \\\\ 0 & 0.25 & 0.25 & -0.3 \\endbmatrix\\endgathered wiT=0.21.500.51.30.250.12.10.252.00.00.3偏置 b i = [ 1.1 3.2 − 1.2 ] b_i=\\begingathered\\beginbmatrix 1.1 \\\\ 3.2 \\\\ -1.2 \\endbmatrix\\endgathered bi=1.13.21.2也就是说,对于汽车类,有 w 1 T = [ 0.2 − 0.5 0.1 2.0 ] \\bm w_1^T=\\begingathered\\beginbmatrix 0.2 & -0.5 & 0.1 & 2.0 \\endbmatrix\\endgathered w1T=[0.20.50.12.0]对于猫类,有 w 2 T = [ 1.5 1.3 2.1 0.0 ] \\bm w_2^T=\\begingathered\\beginbmatrix 1.5 & 1.3 & 2.1 & 0.0 \\endbmatrix\\endgathered w2T=[1.51.32.10.0]对于鸟类,有 w 3 T = [ 0 0.25 0.25 − 0.3 ] \\bm w_3^T=\\begingathered\\beginbmatrix 0 & 0.25 & 0.25 & -0.3 \\endbmatrix\\endgathered w3T=5月深度学习班第2课高效计算基础与图像线性分类器

    这节课主要是讲了些基本的numpy,scipy和线性的分类器(图像上面,比如knn),还讲了下一些损失函数一:numpy,scipy和线性的分类器(图像上面,比如knn)主要讲代码注意;axis=0表示列 axis=1表示行numpy.random.rand(d0, d1, ...... 查看详情

    计算机视觉中的深度学习3:线性分类

    Slides:百度云提取码:gs3n线性分类的参数线性分类的公式f(x,W)=Wx+bf(x,W)=Wx+bf(x,W)=Wx+b其中WWW为参数或者权重以一个有101010类的32×32×332\\times32\\times332×32×3的图片为例其中f(x,W)f(x,W)f(x,W)和bbb为(10,)(10,)(10,)向量 查看详情

    斯坦福cs231n—深度学习与计算机视觉----学习笔记课时6

    课时6线性分类器损失函数与最优化(上)多类SVM损失:这是一个两分类支持向量机的泛化SVM损失计算了所有不正确的例子,将所有不正确的类别的评分,与正确类别的评分之差加1,将得到的数值与0作比较,取两者中的最大值。... 查看详情

    斯坦福cs231n—深度学习与计算机视觉----学习笔记课时12&&13

    课时12神经网络训练细节part2(上)训练神经网络是由四步过程组成,你有一个完整的数据集图像和标签,从数据集中取出一小批样本,我们通过网络做前向传播得到损失,告诉我们目前分类效果怎么样。然后我们反向传播来得... 查看详情

    计算机视觉与深度学习笔记ep1

    主要资料来源:(P1-P3)计算机视觉与深度学习北京邮电大学鲁鹏清晰版合集(完整版)_哔哩哔哩_bilibili数据驱动的图像分类方法          数据集收集数据集划分与预处理        训练集:确定超... 查看详情

    全球名校课程作业分享系列--斯坦福计算机视觉与深度学习cs231n之svm图像分类(代码片段)

    课程作业原地址:CS231nAssignment1作业及整理:@谭斌&&@Molly&&@寒小阳时间:2018年1月。出处:http://blog.csdn.net/han_xiaoyang/article/details/70214565任务背景用支持向量机(SVM)的方法去完成图像识别多分类... 查看详情

    深度学习—线性分类器理解

    1、我们将要实现一种更强大的方法来解决图像分类问题,该方法可以自然地延伸到神经网络和卷积神经网络上。这种方法主要有两部分组成:一个是评分函数(scorefunction),它是原始图像数据到类别分值的映射。另一个是损失... 查看详情

    计算机视觉中的深度学习5:神经网络(代码片段)

    Slides:百度云提取码:gs3n前情回顾我们讲解了用线性模型进行图片分类用Loss函数来表示不同的权重的好坏用SGD来训练模型,使得Loss函数最小新的挑战线性分类并不能解决一切问题比如,下图的非线性分类问题再比如&#... 查看详情

    全球名校课程作业分享系列--斯坦福计算机视觉与深度学习cs231n之softmax图像多分类

    课程作业原地址:CS231nAssignment1作业及整理:@林凡莉&&@Molly&&@寒小阳时间:2018年1月。出处:http://blog.csdn.net/han_xiaoyang/article/details/791383521.任务这次练习跟SVM练习类似。你将完成下面的任务ÿ... 查看详情

    cv学习资料《卷积神经网络与视觉计算》+《深度学习实践计算机视觉》+《视觉slam十四讲从理论到实践》电子资料代码分析

    ...图形学真是一家,基础都一样! 如果学习图像识别,计算机视觉,推荐电子书《视觉SLAM十四讲:从理论到实践》,系统介绍了视觉SLAM(同时定位与地图构建)所需的基本知识与核心算法,既包括数学理论基础,如三维空间... 查看详情

    学习笔记计算机视觉与深度学习(3.卷积与图像去噪/边缘提取/纹理表示)

    学习视频:鲁鹏-计算机视觉与深度学习同系列往期笔记:【学习笔记】计算机视觉与深度学习(1.线性分类器)【学习笔记】计算机视觉与深度学习(2.全连接神经网络)1卷积噪声点:该点的像素和周围像素点的差异很大&#... 查看详情

    计算机视觉中的深度学习6:反向传播

    Slides:百度云提取码:gs3n神经网络的梯度下降我们之前在学习线性分类器的时候,使用Loss函数以及梯度下降法来更新权重。那么对于神经网络,我们该如何计算每层神经元的权重呢?对每层W直接求导(愚蠢的... 查看详情

    opencv-python实战(18)——深度学习简介与入门示例(快来一起推开深度学习的大门吧)(代码片段)

    ...示例(快来一起推开深度学习的大门吧)0.前言1.计算机视觉中的深度学习简介1.1深度学习的特点1.2深度学习大爆发2.用于图像分类的深度学习简介3.用于目标检测的深度学习简介4.深度学习框架keras介绍与使用4.1keras库简介... 查看详情

    深度学习初步:

    一、背景介绍  1.深度学习应用  2.一点基础:线性分类器    1)线性分类器得分函数:      (1)给定W,可以由像素映射到类目得分      (2)可以调整参数/权重W,使得映射的结果和实际类别吻合     ... 查看详情

    《深度学习与计算机视觉算法原理框架应用》pdf+《深度学习之pytorch实战计算机视觉》pdf

    下载:https://pan.baidu.com/s/12-s95JrHek82tLRk3UQO_w《深度学习与计算机视觉算法原理、框架应用》PDF,带书签,347页。《大数据架构详解:从数据获取到深度学习》PDF,带书签,373页。配套源代码。下载:https://pan.baidu.com/s/1P0-o29x0ZrXp8Wo... 查看详情

    计算机视觉中的深度学习2:图片分类(代码片段)

    计算机视觉中的深度学习2:图片分类Slides:百度云提取码:gs3n计算机与人眼的区别对于一张灰度图片,计算机能看到的是像素大小的0~255的灰度值;对于RGB图片,则是一张像素大小的3通道矩阵,即800x600x3。计算... 查看详情

    斯坦福cs231n—深度学习与计算机视觉----学习笔记课时26&&27

    课时26图像分割与注意力模型(上)语义分割:我们有输入图像和固定的几个图像分类,任务是我们想要输入一个图像,然后我们要标记每个像素所属的标签为固定数据类中的一个使用卷积神经,网络为每个小区块进行分类,对... 查看详情

    全球名校课程作业分享系列--斯坦福计算机视觉与深度学习cs231n之特征抽取与图像分类提升(代码片段)

    课程作业原地址:CS231nAssignment1作业及整理:@邓妍蕾&&@Molly&&@寒小阳时间:2018年1月。出处:http://blog.csdn.net/han_xiaoyang/article/details/791400840.前言我们已经看到,通过用输入 查看详情