正文

机器学习之logistic回归算法

追寻的鹿  追寻的鹿  2022-09-30  500

关键词：

声明：本篇博文是学习《机器学习实战》一书的方式路程，系原创，若转载请标明来源。

1 Logistic 回归算法的原理

1.1 需要的数学基础

我在看机器学习实战时对其中的代码非常费解，说好的利用偏导数求最值怎么代码中没有体现啊，就一个简单的式子：θ= θ - α Σ [( h_θ(x⁽ⁱ⁾)-y⁽ⁱ⁾) ] * x_{i 。}经过查找资料才知道，书中省去了大量的理论推导过程，其中用到了线性函数、sigmoid 函数、偏导数、最大似然函数、梯度下降法。下面让我们一窥究竟，是站在大神的肩膀描述我自己的见解。

1.2 Logistic 回归的引入

Logistic 回归是概率非线性模型，用于处理二元分类结果，名为回归实为分类。下面给出一个二元分类的例子，如下图所示：

图中数据分成两类，打叉的一类用 y = 1 表示，另一类为圆圈用 y= 0 表示。现在我们要对数据进行分类，要找到一个分类函数(边界线)，我们很容易得出一个线性函数对其分类：0 = θ₀ + θ₁x₁ + θ₂x₂ 。但我们想要的函数应该是，能接受所有的输入然后预测类别。例如：在两个分类的情况下，函数输出 0 或 1。因此，我们就需要引入Sigmoid 函数，这个函数的性质可以满足要求。Sigmoid 函数：

Sigmoid 函数的值域为（0,1），且具有良好的从0 到 1 的跳跃性，如在两个不同的坐标尺度下的函数图形：

所以，我们把线性方程和Sigmoid 函数结合起来就能解决问题。即：分类预测函数 h_θ (x) = g( θ₀ + θ₁x₁ + θ₂x₂) .我们就可以对样本数据进行分类，如下图所示：

对于线性的分类边界，如下形式：

分类预测函数，如下形式：

其中，θ^T是向量 θ (θ₀, θ₁,... ,θ_n) 的转置，向量 x ( x₀, x₁ ,... , x_n)，n -1为数据的维度，x₀ =1，这是便于计算。

1.3 分类预测函数问题的转化成求θ

通过上面的分析，我们得出了分类预测函数 h_θ(x) , 但其中向量 x 是已知的（x 是未知类别号的对象数据），向量 θ 未知，即我们把求分类函数问题转化成求向量 θ 。因为Sigmoid 函数的取值区间（0,1），那我们可以看做概率 P（y = 1 | x_i ; θ）= h_θ(x) , 表示在 x_i 确定的情况下，类别 y = 1 的概率。由此，我们也可以得出在 x_i 确定的情况下，类别 y = 0 的概率 P（y = 0 | x_i ; θ）= 1 - P（y = 1 | x_i ; θ）= 1 - h_θ(x) . 即：

我们可以将这两个式子合并得：

其中的 y = 0 或 1 .

这时候我们可以利用最大似然函数对向量 θ 求值，可以理解为选取的样本数据的概率是最大的，那么样本数为 m 的似然函数为：

通过对数的形式对似然函数进行变化，对数似然函数：

这里的最大似然函数的值就是我们所要求的向量 θ , 而求解的方法利用梯度下降法。

1.4 梯度下降法求解θ

在用梯度下降法时，我们将会利用Sigmoid 函数的一个性质： g^,(z) = g(z）[ 1- g(z) ] 。

构造一个Cost函数（损失函数），该函数表示预测的输出（h）与训练数据类别（y）之间的偏差，可以是二者之间的差（h-y）或者是其他的形式。综合考虑所有训练数据的“损失”，将Cost求和或者求平均，记为J(θ)函数，表示所有训练数据预测值与实际类别的偏差。

损失函数：

J(θ)代价函数：

其中，x⁽ⁱ⁾每个样本数据点在某一个特征上的值，即特征向量x的某个值，y(i) 是类别号，m 是样本对象个数。

梯度下降法含义：

梯度下降法，就是利用负梯度方向来决定每次迭代的新的搜索方向，使得每次迭代能使待优化的目标函数逐步减小。梯度其实就是函数的偏导数。

这里对用梯度下降法对 J (θ) 求最小值，与求似然函数的最大值是一样的。则 J(θ) 最小值的求解过程：

其中 α 是步长。

则可以得出：

因为 α 是个常量，所以一般情况可以把 1/m 省去，省去不是没有用1/m ，只是看成 α 和1/m 合并成 α 。

最终式子为：

这就是一开始，我对代码中公式困惑的地方。在这里我在补充一点，以上的梯度下降法可以认为是批量梯度下降法（Batch Gradient Descent），由于我们有m个样本，这里求梯度的时候就用了所有m个样本的梯度数据。下面介绍随机梯度下降法（Stochastic Gradient Descent）：

随机梯度下降法，其实和批量梯度下降法原理类似，区别在与求梯度时没有用所有的m个样本的数据，而是仅仅选取一个样本j来求梯度。随机梯度下降法，和4.1的批量梯度下降法是两个极端，一个采用所有数据来梯度下降，一个用一个样本来梯度下降。自然各自的优缺点都非常突出。对于训练速度来说，随机梯度下降法由于每次仅仅采用一个样本来迭代，训练速度很快，而批量梯度下降法在样本量很大的时候，训练速度不能让人满意。对于准确度来说，随机梯度下降法用于仅仅用一个样本决定梯度方向，导致解很有可能不是最优。对于收敛速度来说，由于随机梯度下降法一次迭代一个样本，导致迭代方向变化很大，不能很快的收敛到局部最优解。公式为：

到这里已经把Logistics 回归的原理推导完成。这里对以上推导做一次总结：

边界线 ——> Sigmoid 函数 ——>求向量 θ ——> P(y=1 | x ; θ) = h_θ(x) —— > 似然函数 l (θ) ——> 代价函数 J (θ) ——> 梯度下降法求解向量 θ ——> 最终公式 θ_j

2 使用python 实现Logistic 回归

2.1 Logistic 回归梯度上升优化算法

2.1.1 收集数据和处理数据

1 # 从文件中提取数据
2 def loadDataSet():
3     dataMat = [] ; labelMat = []
4     fr = open('testSet.txt')
5     for line in fr.readlines(): # 对文件的数据进行按行遍历
6         lineArr  = line.strip().split()
7         dataMat.append([1.0, float(lineArr [0]), float(lineArr[1])])
8         labelMat.append(int(lineArr[2])) # 数据的类别号列表
9     return dataMat , labelMat

2.1.2 Sigmoid 函数

1 # 定义sigmoid 函数
2 def sigmoid(inX):
3     return longfloat( 1.0 / (1 + exp(-inX)))

使用longfloat() 是为防止溢出。

2.1.3 批量梯度上升算法的实现

 1 # Logistic 回归梯度上升优化算法
 2 def gradAscent(dataMatIn, classLabels):
 3     dataMatrix = mat(dataMatIn) # 将数列转化成矩阵
 4     labelMat = mat(classLabels).transpose() # 将类标号转化成矩阵并转置成列向量
 5     m,n = shape(dataMatrix) # 获得矩阵dataMatrix 的行、列数
 6     alpha = 0.001 # 向目标移动的步长
 7     maxCycles = 500 # 迭代次数
 8     weights = ones((n ,1)) # 生成 n 行 1 列的 矩阵且值为1
 9     for k in range(maxCycles):
10         h = sigmoid(dataMatrix*weights) # dataMatrix*weights 是 m * 1 的矩阵，其每一个元素都会调用sigmoid()函数，h 也是一个 m * 1 的矩阵
11         error = (labelMat - h) # 损失函数
12         weights = weights + alpha + dataMatrix.transpose()* error # 每步 weights 该变量
13     return weights.getA()

解释第 13 行代码：矩阵通过这个getA()这个方法可以将自身返回成一个n维数组对象，因为plotBestFit()函数中有计算散点x,y坐标的部分，其中计算y的时候用到了weights，如果weights是矩阵的话，weights[1]就是[0.48007329]（注意这里有中括号！），就不是一个数了，最终你会发现y的计算结果的len()只有1，而x的len()则是60。

2.2 根据批量梯度上升法分析数据：画出决策边界

 1 # 对数据分类的边界图形显示
 2 def plotBestFit(weights):
 3     import matplotlib.pyplot as plt
 4     dataMat,labelMat=loadDataSet()
 5     dataArr = array(dataMat)
 6     n = shape(dataArr)[0] # 数据的行数，即对象的个数
 7     xcord1 = []; ycord1 = [] # 对类别号为 1 的对象，分 X 轴和 Y 轴的数据
 8     xcord2 = []; ycord2 = [] # 对类别号为 0 的对象，分 X 轴和 Y 轴的数据
 9     for i in range(n): # 对所有的对象进行遍历
10         if int(labelMat[i])== 1:  # 对象的类别为：1
11             xcord1.append(dataArr[i,1]); ycord1.append(dataArr[i,2])
12         else:
13             xcord2.append(dataArr[i,1]); ycord2.append(dataArr[i,2])
14     fig = plt.figure()
15     ax = fig.add_subplot(111)
16     ax.scatter(xcord1, ycord1, s=30, c='red', marker='s') # 对散点的格式的设置，坐标号、点的大小、颜色、点的图形（方块）
17     ax.scatter(xcord2, ycord2, s=30, c='green') # 点的图形默认为圆
18     x = arange(-3.0, 3.0, 0.1)
19     y = (-weights[0]-weights[1]*x)/weights[2] # 线性方程 y = aX + b,y 是数据第三列的特征，X 是数据第二列的特征
20     ax.plot(x, y)
21     plt.xlabel('X1'); plt.ylabel('X2')
22     plt.show()

运行结果：

有结果效果图可知，边界线基本可以对样本进行较好的分类。

2.3 利用随机梯度上升法训练样本

 1 # 随机梯度上升法
 2 def stocGradAscent0(dataMatrix, classLabels, numIter=150):
 3     m,n = shape(dataMatrix )
 4     weights = ones(n)
 5     for j in range(numIter): # 迭代次数
 6         dataIndex = range(m) #
 7         for i in range(m): # 对所有对象的遍历
 8             alpha = 4/(1.0+j+i)+0.01  # 对步长的调整
 9             randIndex = int (random.uniform(0,len(dataIndex))) # 随机生成一个整数，介于 0 到 m
10             h = sigmoid(sum(dataMatrix[randIndex]*weights)) # 对随机选择的对象计算类别的数值（回归系数值）
11             error = classLabels[randIndex] - h # 根据实际类型与计算类型值的误差，损失函数
12             weights = weights + alpha * error * dataMatrix[randIndex]  # 每步 weights 改变值
13             del(dataIndex [randIndex]) # 去除已经选择过的对象，避免下次选中
14     return weights

在随机梯度上升法求解的 θ ，对样本进行分类，并画出其边界线，运行的结果图：

利用随机梯度上升法，通过150 次迭代得出的效果图和批量梯度上升法的效果图差不过，但随机梯度的效率比批量梯度上升法快很多。

3 实例：从疝气病症预测病马的死亡率

3.1 未知对象的预测

1 # 对未知对象进行预测类别号
2 def classifyVector(inX , weights):
3     prob = sigmoid(sum(inX * weights)) # 计算回归系数
4     if prob > 0.5:
5         return 1.0
6     else:
7         return 0.0

3.2 样本数据和测试函数

 1 # 实例：从疝气病预测病马的死亡率
 2 def colicTest():
 3     frTrain = open('horseColicTraining.txt'); frTest = open('horseColicTest.txt')# 数据文件
 4     trainingSet = []; trainingLabels = [] # 样本集和类标号集的初始化
 5     for line in frTrain.readlines():
 6         currLine = line.strip().split('\t') # 根据制表符进行字符串的分割
 7         lineArr =[]
 8         for i in range(21):
 9             lineArr.append(float(currLine[i]))
10         trainingSet.append(lineArr)
11         trainingLabels.append(float(currLine[21]))
12     #trainWeights = stocGradAscent0(array(trainingSet), trainingLabels, 500) # 通过对训练样本计算出回归系数
13     trainWeights = gradAscent(array(trainingSet), trainingLabels)   # 通过对训练样本计算出回归系数
14     errorCount = 0; numTestVec = 0.0 # 错误个数和错误率的初始化
15     # 预测样本的遍历
16     for line in frTest.readlines():
17         numTestVec += 1.0
18         currLine = line.strip().split('\t')
19         lineArr =[]
20         for i in range(21):
21             lineArr.append(float(currLine[i]))
22         if int(classifyVector(array(lineArr), trainWeights))!= int(currLine[21]): # 预测的类别号与真实类别号的比较
23             errorCount += 1
24     errorRate = (float(errorCount)/numTestVec)
25     print u'本次测试的错误率是; %f' % errorRate
26     return errorRate

3.3 预测结果函数

1 # 预测结果函数
2 def multiTest():
3     numTests = 10; errorSum = 0.0
4     for k in range(numTests):
5         errorSum += colicTest()
6     print u'经过 %d 次测试结果的平均错误率是： %f ' % (numTests ,errorSum /float(numTests))

利用随机梯度上升法训练的样本集，测试结果：

利用批量梯度上升法训练的样本集，测试结果：

附完整程序

  1 # coding:utf-8
  2 from numpy import *
  3 
  4 # 从文件中提取数据
  5 def loadDataSet():
  6     dataMat = [] ; labelMat = []
  7     fr = open('testSet.txt')
  8     for line in fr.readlines(): # 对文件的数据进行按行遍历
  9         lineArr  = line.strip().split()
 10         dataMat.append([1.0, float(lineArr [0]), float(lineArr[1])])
 11         labelMat.append(int(lineArr[2])) # 数据的类别号列表
 12     return dataMat , labelMat
 13 
 14 # 定义sigmoid 函数
 15 def sigmoid(inX):
 16     return longfloat( 1.0 / (1 + exp(-inX)))
 17 
 18 # Logistic 回归批量梯度上升优化算法
 19 def gradAscent(dataMatIn, classLabels):
 20     dataMatrix = mat(dataMatIn) # 将数列转化成矩阵
 21     labelMat = mat(classLabels).transpose() # 将类标号转化成矩阵并转置成列向量
 22     m,n = shape(dataMatrix) # 获得矩阵dataMatrix 的行、列数
 23     alpha = 0.001 # 向目标移动的步长
 24     maxCycles = 500 # 迭代次数
 25     weights = ones((n ,1)) # 生成 n 行 1 列的 矩阵且值为1
 26     for k in range(maxCycles):
 27         h = sigmoid(dataMatrix*weights) # dataMatrix*weights 是 m * 1 的矩阵，其每一个元素都会调用sigmoid()函数，h 也是一个 m * 1 的矩阵
 28         error = (labelMat - h) # 损失函数
 29         weights = weights + alpha + dataMatrix.transpose()* error # 每步 weights 该变量
 30     return weights.getA()
 31 
 32 # 对数据分类的边界图形显示
 33 def plotBestFit(weights):
 34     import matplotlib.pyplot as plt
 35     dataMat,labelMat=loadDataSet()
 36     dataArr = array(dataMat)
 37     n = shape(dataArr)[0] # 数据的行数，即对象的个数
 38     xcord1 = []; ycord1 = [] # 对类别号为 1 的对象，分 X 轴和 Y 轴的数据
 39     xcord2 = []; ycord2 = [] # 对类别号为 0 的对象，分 X 轴和 Y 轴的数据
 40     for i in range(n): # 对所有的对象进行遍历
 41         if int(labelMat[i])== 1:  # 对象的类别为：1
 42             xcord1.append(dataArr[i,1]); ycord1.append(dataArr[i,2])
 43         else:
 44             xcord2.append(dataArr[i,1]); ycord2.append(dataArr[i,2])
 45     fig = plt.figure()
 46     ax = fig.add_subplot(111)
 47     ax.scatter(xcord1, ycord1, s=30, c='red', marker='s') # 对散点的格式的设置，坐标号、点的大小、颜色、点的图形（方块）
 48     ax.scatter(xcord2, ycord2, s=30, c='green') # 点的图形默认为圆
 49     x = arange(-3.0, 3.0, 0.1)
 50     y = (-weights[0]-weights[1]*x)/weights[2] # 线性方程 y = aX + b,y 是数据第三列的特征，X 是数据第二列的特征
 51     ax.plot(x, y)
 52     plt.xlabel('X1'); plt.ylabel('X2')
 53     plt.show()
 54 
 55 # 随机梯度上升法
 56 def stocGradAscent0(dataMatrix, classLabels, numIter=150):
 57     m,n = shape(dataMatrix )
 58     weights = ones(n)
 59     for j in range(numIter): # 迭代次数
 60         dataIndex = range(m) #
 61         for i in range(m): # 对所有对象的遍历
 62             alpha = 4/(1.0+j+i)+0.01  # 对步长的调整
 63             randIndex = int (random.uniform(0,len(dataIndex))) # 随机生成一个整数，介于 0 到 m
 64             h = sigmoid(sum(dataMatrix[randIndex]*weights)) # 对随机选择的对象计算类别的数值（回归系数值）
 65             error = classLabels[randIndex] - h # 根据实际类型与计算类型值的误差，损失函数
 66             weights = weights + alpha * error * dataMatrix[randIndex]  # 每步 weights 改变值
 67             del(dataIndex [randIndex]) # 去除已经选择过的对象，避免下次选中
 68     return weights
 69 
 70 # 对未知对象进行预测类别号
 71 def classifyVector(inX , weights):
 72     prob = sigmoid(sum(inX * weights)) # 计算回归系数
 73     if prob > 0.5:
 74         return 1.0
 75     else:
 76         return 0.0
 77 
 78 # 实例：从疝气病预测病马的死亡率
 79 def colicTest():
 80     frTrain = open('horseColicTraining.txt'); frTest = open('horseColicTest.txt')# 数据文件
 81     trainingSet = []; trainingLabels = [] # 样本集和类标号集的初始化
 82     for line in frTrain.readlines():
 83         currLine = line.strip().split('\t') # 根据制表符进行字符串的分割
 84         lineArr =[]
 85         for i in range(21):
 86             lineArr.append(float(currLine[i]))
 87         trainingSet.append(lineArr)
 88         trainingLabels.append(float(currLine[21]))
 89     trainWeights = stocGradAscent0(array(trainingSet), trainingLabels, 500) # 通过随机梯度上升法计算回归系数
 90     #trainWeights = gradAscent(array(trainingSet), trainingLabels)   # 通过批量梯度上升法计算出回归系数
 91     errorCount = 0; numTestVec = 0.0 # 错误个数和错误率的初始化
 92     # 预测样本的遍历
 93     for line in frTest.readlines():
 94         numTestVec += 1.0
 95         currLine = line.strip().split('\t')
 96         lineArr =[]
 97         for i in range(21):
 98             lineArr.append(float(currLine[i]))
 99         if int(classifyVector(array(lineArr), trainWeights))!= int(currLine[21]): # 预测的类别号与真实类别号的比较
100             errorCount += 1
101     errorRate = (float(errorCount)/numTestVec)
102     print u'本次测试的错误率是; %f' % errorRate
103     return errorRate
104 
105 # 预测结果函数
106 def multiTest():
107     numTests = 10; errorSum = 0.0
108     for k in range(numTests):
109         errorSum += colicTest()
110     print u'经过 %d 次测试结果的平均错误率是： %f ' % (numTests ,errorSum /float(numTests))
111 
112 if __name__ == '__main__':
113   # 用批量梯度上升法画边界线
114     '''
115     dataSet, labelSet = loadDataSet()
116     #weights = gradAscent(dataSet, labelSet)
117     #plotBestFit(weights)
118     '''
119     # 用随机梯度上升法画边界线
120     '''
121      dataSet, labelSet = loadDataSet()
122     #weightss = stocGradAscent0(array(dataSet), labelSet )
123     #plotBestFit(weightss)
124    '''
125    # 实例的预测
126     multiTest()

View Code

机器学习之线性回归以及logistic回归

1、线性回归回归的目的是预测数值型数据的目标值。目标值的计算是通过一个线性方程得到的，这个方程称为回归方程，各未知量（特征）前的系数为回归系数，求这些系数的过程就是回归。对于普通线性回归使用的损失函数... 查看详情

机器学习之线性回归---logistic回归---softmax回归

1摘要本报告是在学习斯坦福大学机器学习课程前四节加上配套的讲义后的总结与认识。前四节主要讲述了回归问题，回归属于有监督学习中的一种方法。该方法的核心思想是从连续型统计数据中得到数学... 查看详情

机器学习之学习路线

机器学习机器学习朴素贝叶斯（NBC) 决策树K-近邻算法回归K-均值聚类算法Apriori算法FP-growth算法主成分分析（PCA)奇异值分析（SVD)支持向量机logistic回归python实现明星专家系统http://9399369.blog.51cto.com/9389369/d-22/p-2本文出自“运维... 查看详情

机器学习之逻辑回归

2.逻辑回归简述Logistic回归算法基于Sigmoid函数，或者说Sigmoid就是逻辑回归函数。Sigmoid函数定义如下： 11+e?z。函数值域范围(0,1)。因此逻辑回归函数的表达式如下： hθ(x)=g(θTX)=11+e?θTX其中，g(z)=11+e?z其导数形式为： g′... 查看详情

机器学习之logistic回归(代码片段)

　　都说万事开头难，可一旦开头，就是全新的状态，就有可能收获自己未曾预料到的成果。记录是为了更好的监督、理解和推进，学习过程中用到的数据集和代码都将上传到github　　回归是对一个或多个自变量和因变量之间的... 查看详情

4.机器学习之逻辑回归算法

理论上讲线性回归模型既可以用于回归，也可以用于分类。解决回归问题，可以用于连续目标值的预测。但是针对分类问题，该方法则有点不适应，因为线性回归的输出值是不确定范围的，无法很好的一一对应到我们的若干分类... 查看详情

机器学习之线性回归(代码片段)

目录预测数值型数据：回归用线性回归找到最佳拟合直线程序8-1标准回归函数和数据导入函数程序8-2基于程序8-1绘图图片8-1ex0的数据集和它的最佳拟合直线局部加权线性回归图片8-2参数k与权重的关系程序8-3局部加权线性回归函... 查看详情

机器学习之线性回归算法

...回归算法总结：　　回归是统计学中最有力的工具之一。机器习监督学习算法分为分类算法和回归算法两种，其实就是根据类别标签分布类型为离散型、连续性而定义的。回归算法用于连续型分布预测，针对的是数值型的样本，... 查看详情

机器学习之线性回归

1.机器学习算法**监督学习：**已经知道类别的样本，通过一定的模型或者是特定的算法，可以预测出某种特定的结果，例如预测房价，最终可以预测出房价是什么，或者是预测肿瘤疾病，判断肿瘤是良... 查看详情

机器学习之线性回归

机器学习之k-means算法

前言以下内容是个人学习之后的感悟，转载请注明出处~ 简介　　在之前发表的线性回归、逻辑回归、神经网络、SVM支持向量机等算法都是监督学习算法，需要样本进行训练，且样本的类别是... 查看详情

机器学习之五：神经网络反向传播算法(代码片段)

一、逻辑回归的局限在逻辑回归一节中，使用逻辑回归的多分类，实现了识别20*20的图片上的数字。但所使用的是一个一阶的模型，并没有使用多项式，为什么？可以设想一下，在原有400个特征的数据样本中，增加二次、三次、... 查看详情

机器学习之回归简介

线性回归综述目的是找到一个映射，最能反映二者之间的关系。用来预测当有新的样本输入的时候，输入的结果线性回归处理的变量必须是连续的。欠拟合&过拟合过拟合跟欠拟合是ml算法表现差的两大原因欠拟合：... 查看详情

20171028机器学习之线性回归过拟合问题的解决方案

在函数中加入一个正则项：三种方式：一、Ridge回归（岭回归）：　　优点：具有较高的准确性、鲁棒性以及稳定性　　缺点：求解速度慢二、Lasso回归：　　优点：求解速度快（原理降维计算，把数据维度中存在的噪音和... 查看详情

《机器学习实战》logistic回归算法

=====================================================================《机器学习实战》系列博客是博主阅读《机器学习实战》这本书的笔记也包含一些其他python实现的机器学习算法查看详情

机器学习之逻辑回归

1.用自己的话描述一下，什么是逻辑回归，与线性回归对比，有什么不同？逻辑回归又称逻辑回归分析，是一种广义的线性回归分析模型，常用于数据挖掘，疾病自动诊断，经济预测等领域；与线性回归相比大致有两大不同：①... 查看详情

机器学习之线性回归

1.线性回归简述在统计学中，线性回归（LinearRegression）是利用称为线性回归方程的最小平方函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。这种函数是一个或多个称为回归系数的模型参数的线性组合（自变... 查看详情

机器学习之逻辑回归(logisticregression)

"""逻辑回归中的Sigmoid函数""" importnumpyasnp importmatplotlib.pyplotasplt defsigmoid(t): return1/(1+np.exp(-t)) x=np.linspace(-10,10,500) y=sigmoid 查看详情

正文

机器学习之logistic回归算法

1 Logistic 回归算法的原理

1.1 需要的数学基础

1.2 Logistic 回归的引入

1.3 分类预测函数问题的转化成求θ

1.4 梯度下降法求解θ

2 使用python 实现Logistic 回归

2.1 Logistic 回归梯度上升优化算法

2.1.1 收集数据和处理数据

2.1.2 Sigmoid 函数

2.1.3 批量梯度上升算法的实现

2.2 根据批量梯度上升法分析数据：画出决策边界

2.3 利用随机梯度上升法训练样本

3 实例：从疝气病症预测病马的死亡率

3.1 未知对象的预测

3.2 样本数据和测试函数

3.3 预测结果函数

附 完整程序

机器学习之线性回归以及logistic回归

机器学习之线性回归---logistic回归---softmax回归

机器学习之学习路线

机器学习之逻辑回归

机器学习之logistic回归(代码片段)

4.机器学习之逻辑回归算法

机器学习之线性回归(代码片段)

机器学习之线性回归算法

机器学习之线性回归

机器学习之线性回归

机器学习之k-means算法

机器学习之五：神经网络反向传播算法(代码片段)

机器学习之回归简介

20171028机器学习之线性回归过拟合问题的解决方案

《机器学习实战》logistic回归算法

机器学习之逻辑回归

机器学习之线性回归

机器学习之逻辑回归(logisticregression)

附完整程序