正文

计算机视觉与深度学习线性分类器

CCH²¹  CCH²¹  2022-12-25  590

关键词：

从线性分类器开始

线性分类器形式简单，易于理解。
通过层级结构（神经网络）或高维映射（支持向量机）可以形成功能强大的非线性模型。

线性分类器的定义

线性分类器是一种线性映射，将输入的图像特征映射为类别分数。线性分类器定义如下： $f_i(\\bm x, \\bm w_i)=\\bm w_i^T \\bm x+b_i,i=1,2,...,c$ 其中 $\\bm x$ 代表输入的 $d$ 维图像向量， $c$ 为类别个数， $\\bm w_i=\\begingathered\\beginbmatrix w_i1 & w_i2 & ... & w_id \\endbmatrix\\endgathered^T$ 为第 $i$ 个类别的权值向量， $b_i$ 为偏置。如果 $f_i(\\bm x)>f_j(\\bm x)$ ，则决策输入图像 $\\bm x$ 属于第 $i$ 类。

线性分类器的决策步骤

将图像表示为向量。
假设我们有一张图片 $\\begingathered\\beginbmatrix 56 & 231 \\\\ 24 & 2 \\endbmatrix\\endgathered$ 将其转换为向量的形式即为 $\\bm x=\\begingathered\\beginbmatrix 56 \\\\ 231 \\\\ 24 \\\\ 2 \\endbmatrix\\endgathered$
计算当前图片每个类别的分数。
假设我们当前需要完成的是一个三分类任务（将图片划分为汽车类、猫类、鸟类的其中一种），线性分类器为 $f_i(\\bm x, \\bm w_i)=\\bm w_i^T \\bm x+b_i,i=1,2,3$ 其中权值矩阵 $\\bm w_i^T=\\begingathered\\beginbmatrix 0.2 & -0.5 & 0.1 & 2.0 \\\\ 1.5 & 1.3 & 2.1 & 0.0 \\\\ 0 & 0.25 & 0.25 & -0.3 \\endbmatrix\\endgathered$ 偏置 $b_i=\\begingathered\\beginbmatrix 1.1 \\\\ 3.2 \\\\ -1.2 \\endbmatrix\\endgathered$ 也就是说，对于汽车类，有 $\\bm w_1^T=\\begingathered\\beginbmatrix 0.2 & -0.5 & 0.1 & 2.0 \\endbmatrix\\endgathered$ 对于猫类，有 $\\bm w_2^T=\\begingathered\\beginbmatrix 1.5 & 1.3 & 2.1 & 0.0 \\endbmatrix\\endgathered$ 对于鸟类，有 $\\bm w_3^T=\\begingathered\\beginbmatrix 0 & 0.25 & 0.25 & -0.3 \\endbmatrix\\endgathered$

正文

计算机视觉与深度学习线性分类器

目录

从线性分类器开始

线性分类器的定义

线性分类器的决策步骤

计算机视觉中的深度学习3:线性分类

斯坦福cs231n—深度学习与计算机视觉----学习笔记课时6

斯坦福cs231n—深度学习与计算机视觉----学习笔记课时12&&13

计算机视觉与深度学习笔记ep1

全球名校课程作业分享系列--斯坦福计算机视觉与深度学习cs231n之svm图像分类(代码片段)

深度学习—线性分类器理解

计算机视觉中的深度学习5:神经网络(代码片段)

全球名校课程作业分享系列--斯坦福计算机视觉与深度学习cs231n之softmax图像多分类

cv学习资料《卷积神经网络与视觉计算》+《深度学习实践计算机视觉》+《视觉slam十四讲从理论到实践》电子资料代码分析

学习笔记计算机视觉与深度学习(3.卷积与图像去噪/边缘提取/纹理表示)

计算机视觉中的深度学习6:反向传播

opencv-python实战（18）——深度学习简介与入门示例（快来一起推开深度学习的大门吧）(代码片段)

深度学习初步：

《深度学习与计算机视觉算法原理框架应用》pdf+《深度学习之pytorch实战计算机视觉》pdf

计算机视觉中的深度学习2:图片分类(代码片段)

斯坦福cs231n—深度学习与计算机视觉----学习笔记课时26&&27

全球名校课程作业分享系列--斯坦福计算机视觉与深度学习cs231n之特征抽取与图像分类提升(代码片段)