正文

pytorch深度学习——逻辑斯蒂回归（分类问题）（b站刘二大人p6学习笔记）(代码片段)

学习CV的研一小白  学习CV的研一小白  2023-01-27  179

关键词：

1 什么是分类问题？

2 为什么要使用逻辑斯蒂回归？

3 Sigmid Founction（逻辑斯蒂回归函数）

3.1 模型的改变

3.2 损失函数的改变（BCE Loss）

3.3 代码的改变

1 什么是分类问题？

分类问题，与之前学习的线性回归问题不同，输出的是分类的概率值，在训练过程中，计算它属于每一个分类的所有概率，其中概率最大的那一种分类，就是我们要的输出结果。
~~（在PyTorch中 torchvison包提供一些主流的数据集，root：下载路径。train：是选择训练集还是测试集。download：是否需要下载，第一次使用需要下载）。~~
现在我们将之前的学习问题，修改成分类问题，x表示学习时间，y表示通过率，0表示不通过，1表示通过，这也叫做”二分类问题“

2 为什么要使用逻辑斯蒂回归？

在之前我们的学习中，最终预测的是一个实数，而针对分类问题，我们要把输出的实数映射成一个0到1的概率（ [0,1] ），这个映射的过程就是本节课所学的逻辑斯蒂回归，逻辑斯蒂回归利用公式，将实数域的数值映射到 [0.1]范围内的概率。逻辑斯蒂函数的图像如下所示：

逻辑斯蒂函数在数学界被分为——饱和函数。

计算概率的方式：将原本计算的实数作为变量输入到逻辑斯蒂函数中，输出的就是映射之后的概率值。

3 Sigmid Founction（逻辑斯蒂回归函数）

Sigmid Founction需要满一下三个条件：

函数值有极限
是单调增函数
是饱和函数

Sigmid Founction中最具有典型性的函数就是逻辑斯蒂函数。其他的一些Sigmid Founction如下图所示：

3.1 模型的改变

之前学习的函数与逻辑斯蒂回归函数的计算图的区别：可以看出逻辑斯蒂回归函数在计算出之后，还多了一步——通过使用逻辑斯蒂回归函数，把实数值映射到【0，1】的区间中，再输出。

注：（一般就代表逻辑斯蒂回归）

3.2 损失函数的改变（BCE Loss）

之前学习的函数的损失：计算的是两个实数值的差值，是数轴上的距离。

逻辑斯蒂回归函数的损失：输出的是一个分布，需要计算的是两类分布之间的差异，在统计学中的计算方法有——KL散度，cross-entropy（交叉熵）等，这里我们使用的是cross-entropy（交叉熵）方法。

交叉熵：例如：现有两个分布和，此时交叉熵公式为：

这个公式的值表示两个分布之间的差异的大小，值越大，差异越小。在本例中，在公式前加了负号，目的是为了符合我们的平时思维，使Loss越小，差异越小。

具体解释：在本例中，是二分类问题，的取值只能是0或1，的取值只能，Loss函数如下：

当时，，此时，因为，函数是单调递增函数，此时越大，也就是越接近1，的值越小，差异越小；
当时，，此时，因为，函数是单调递增函数，此时越小，也就是越接近0，的值越小，差异越小；

（有点绕，可以自己多推几次）

最终我们计算的总和公式如下：

补充：关于交叉熵的详细解释见链接：

一文搞懂交叉熵在机器学习中的使用，透彻理解交叉熵背后的直觉_史丹利复合田的博客-CSDN博客

3.3 代码的改变

def __init__没有改变：原因是，（逻辑斯蒂回归函数）是一个没有参数的函数，不需要在构造函数中进行初始化，直接调用就可以；

数据集的改变：因为是二分类问题，的取值只能是0或1；

模型的改变：由于PyTorch版本更新，不用再导入torch.nn.functional包，可以直接使用包中的Sigmoid函数进行训练，如下图；

损失函数的改变：不再使用MSE损失函数，改为使用BCE损失函数，由于PyTorch版本更新，将 size_average=False 更改为 reduction='sum'

完整代码如下：

import matplotlib.pyplot as plt
import torch
import matplotlib.pyplot as pl
import numpy as np

x_data = torch.Tensor([[1.0], [2.0], [3.0]])
y_data = torch.Tensor([[0], [0], [1]])


class LogisticRegressionModel(torch.nn.Module):
    # 构造函数：初始化对象默认调用的函数
    def __init__(self):
        # 必写
        super(LogisticRegressionModel, self).__init__()
        # 构造对象
        self.linear = torch.nn.Linear(1, 1)

    # 前馈任务所要进行的计算
    def forward(self, x):
        y_pred = torch.sigmoid(self.linear(x))
        return y_pred


# 实例化
model = LogisticRegressionModel()

# 损失函数对象
criterion = torch.nn.BCELoss(reduction='sum')
# 优化器对象
optimizer = torch.optim.SGD(model.parameters(), lr=0.01)

# 进行训练
for epoch in range(1000):
    # 计算y hat
    y_pred = model(x_data)
    # 计算损失
    loss = criterion(y_pred, y_data)
    print(epoch, loss.item())

    # 所有权重每次都梯度清零
    optimizer.zero_grad()
    # 反向传播求梯度
    loss.backward()
    # 更新，step（）更新函数
    optimizer.step()

# 画图
x = np.linspace(0, 10, 200)
x_t = torch.Tensor(x).view((200, 1))
y_t = model(x_t)
y = y_t.data.numpy()
plt.plot(x, y)
plt.plot([0, 10], [0.5, 0.5], c='r')
plt.xlabel('Hours')
plt.ylabel('Probability of Pass')
plt.grid
plt.show()

运行截图如下：

logisticregression

参考资料：1.李航《统计学习方法》；2.https://blog.csdn.net/laobai1015/article/details/78113214基础：1.知道分类问题和回归问题的区别；一、逻辑斯蒂回归的基本概念1.逻辑斯蒂回归是一种分类算法，最常用的二项逻辑斯蒂回归只适用... 查看详情

李航统计学习方法chapter6逻辑斯蒂回归

第6章逻辑斯蒂回归和最大熵模型逻辑斯谛回归(LR)是经典的分类方法1．逻辑斯谛回归模型是由以下条件概率分布表示的分类模型。逻辑斯谛回归模型可以用于二类或多类分类。P(Y=k∣x)=exp⁡(wk⋅x)1+∑k=1K−1exp⁡(wk... 查看详情

用二项逻辑斯蒂回归解决二分类问题(代码片段)

逻辑斯蒂回归:逻辑斯蒂回归是统计学习中的经典分类方法，属于对数线性模型。logistic回归的因变量可以是二分类的，也可以是多分类的基本原理logistic分布折X是连续的随机变量，X服从logistic分布是指X具有下列分布函数和密度... 查看详情

《动手学深度学习》softmax回归(pytorch版)

softmax-regression1分类问题2softmax回归模型3单样本分类的矢量计算表达式4小批量样本分类的矢量计算表达式5交叉熵损失函数6模型预测及评价小结前几节介绍的线性回归模型适用于输出为连续值的情景。在另一类情景中，模型输... 查看详情

《动手学深度学习》softmax回归(pytorch版)

梯度下降法解逻辑斯蒂回归

...法解逻辑斯蒂回归本文是AndrewNg在Coursera的机器学习课程的笔记。Logistic回归属于分类模型。回顾线性回归，输出的是连续的实数，而Logistic回归输出的是[0,1]区间的概率值，通过概率值来判断因变量应该是1还是0。因此，... 查看详情

logisticregression逻辑斯蒂回归

WelcomeToMyBlogLogisticRegressionlogistic回归是统计学习中的经典分类方法,他属于对数线性模型,logistic回归来源于logistic分布,先从logistic分布说起Logisticdistribution设X是连续随机变量,X服从logistic分布,其分布函数和概率密度函数如... 查看详情

逻辑斯蒂回归(代码片段)

逻辑斯蒂回归（logisticregression）是经典的分类方法。虽然名字中包含回归，但它被用来分类。逻辑斯蒂分布设(X)是随机变量，(X)服从逻辑斯蒂分布是指(X)的概率分布函数(F(x))和概率密度函数(f(x))为：[F(x)=P(Xlex)=frac11+e^-(x-mu)/gamma][f... 查看详情

机器学习之监督学习-分类模型逻辑斯蒂回归

机器学习之监督学习-分类模型逻辑斯蒂回归逻辑斯蒂回归就是用回归的方式找到分类曲线，进行分类，通过一条曲线，拟合分类边界。我们先了解一下sigmod函数，也叫做压缩函数。我们看一下a^x的函数图像，... 查看详情

深度学习：二分分类和部分逻辑回归

1.神经网络就是根据你输入的x信息通过神经网络将他映射成y来输出2.图像领域，经常使用卷积神经网络（CNN）3.序列数据，音频，经常使用RNN（循环神经网络）4.在二分类问题中，是要训练出一个分类器，以图像的特征向量x作为... 查看详情

softmax回归+损失函数+图片分类数据集动手学深度学习v2pytorch

参考https://www.bilibili.com/video/BV1K64y1Q7wu?p=1 查看详情

lecture6逻辑斯蒂回归(logisticregression)(代码片段)

...一个手写数字图像数据集，主要用于训练和测试机器学习模型。它由60,000个训练图像和10,000个测试图像组成，每个图像都是28x28像素的灰度图像，表示一个手写数字。MNIST数据集已成为许多机器学习算法的基准数据集... 查看详情

深度学习入门softmax回归模型

...师推荐了一本书用来入门：《动手学深度学习（PyTorch版）》在此处记录一下学习内容以及学习总结，文章以原作者书查看详情

利用knnsvmcnn逻辑回归mlprnn等方法实现mnist数据集分类（pytorch实现）(代码片段)

电脑配置：python3.6**Pytorch1.2.0**torchvision0.4.0想学习机器学习和深度学习的同学，首先找个比较经典的案例和经典的方法自己动手试一试，分析这些方法的思想和每一行代码是一个快速入门的小技巧，今天我们... 查看详情

《动手学深度学习》线性回归（pytorch版）

线性回归（PyTorch版）1.线性回归1.1线性回归的基本要素1.1.1模型定义1.1.2模型训练(1)训练数据(2)损失函数(3)优化算法1.1.3模型预测1.2线性回归的表示方法1.2.1神经网络图1.2.2矢量计算表达式小结1.线性回归线性回归输出是一... 查看详情

逻辑回归

（注：本文内容和图片来源于林轩田老师的《机器学习基石》课程）1引入逻辑回归通常的二分类问题，希望输出类别；soft的二分类问题，希望输出概率值：对于soft问题的理想数据和实际数据：逻辑回归的思想：先求出... 查看详情

人工智能深度学习机器学习常见面试题121~140

121.逻辑斯蒂回归能否解决非线性分类问题？122.SVM的主要特点（1）非线性映射-理论基础（2）最大化分类边界-方法核心（3）支持向量-计算结果（4）小样本学习方法（5）最终的决策函数只有少量支持向量... 查看详情

机器学习笔记-基于逻辑回归的分类预测(代码片段)

...分类模型，并且广泛应用于各个领域之中。虽然现在深度学习相对于这些传统方法更为火热，但实则这些传统方法由于其独特的优势依然广泛应用于查看详情