机器学习算法分类及其评估指标

author author     2022-08-28     816

关键词:

机器学习的入门,我们需要的一些基本概念:

机器学习的定义

M.Mitchell《机器学习》中的定义是:

对于某类任务T和性能度量P,如果一个计算机程序在T上以P衡量的性能随着经验E而自我完善,那么我们称这个计算机程序从经验E中学习。

 

算法分类

两张图片很好的总结了(机器学习)的算法分类:

技术分享

技术分享

 

 评估指标

分类(Classification)算法指标:

  • Accuracy准确率
  • Precision精确率
  • Recall召回率
  • F1 score

对于分类问题的结果可以用下表表示(说明:True或者False代表预测结果是否正确,Positive和Negative代表被程序找出的结果):

技术分享

 

Accuracy准确率

准确率的定义是对于给定的测试数据集,分类器正确分类的样本数与总样本数之比。公式为:

技术分享

准确率存在准确率悖论的缺陷,参考这里的具体说明。

Precision精确率

精确率计算的是: 预测结果中符合实际值的比例,可以理解为没有“误报”的情形,公式为:

 技术分享

Recall 召回率

召回率计算的是:正确分类的数量与所有“应该”被正确分类(符合目标标签)的数量的比例,可以理解为精确率对应的没有“漏报”的情形。公式为:

技术分享

 F1 score

F1 值是精确率和召回率的调和均值,定义为:

技术分享即, 技术分享

 

应用场景:

准确率和召回率是互相影响的,理想情况下肯定是做到两者都高,但是一般情况下准确率高、召回率就低,召回率低、准确率高,当然如果两者都低,那是什么地方出问题了。当精确率和召回率都高时,F1的值也会高。在两者都要求高的情况下,可以用F1来衡量。

  1. 地震的预测
    对于地震的预测,我们希望的是RECALL非常高,也就是说每次地震我们都希望预测出来。这个时候我们可以牺牲PRECISION。情愿发出1000次警报,把10次地震都预测正确了;也不要预测100次对了8次漏了两次。
  2. 嫌疑人定罪
    基于不错怪一个好人的原则,对于嫌疑人的定罪我们希望是非常准确的。及时有时候放过了一些罪犯(recall低),但也是值得的。

 

回归(Regression)算法指标:

  • Mean Absolute Error平均绝对偏差
  • Mean Squared Error均方误差
  • R2 score
  • Explained Variance Score
 平均绝对误差

公式: 技术分享

 

均方误差

 

公式: 技术分享

 

R2 score

即“Coefficient of determination"决定系数,判断的是预测模型和真实数据的拟合程度,最佳值为1,可为负值。

yˉˉˉ=1nni=1yi

 技术分享

Explained Variance Score

技术分享

 

 

Reference

【1】:http://scikit-learn.org

【2】:机器学习概念参考:http://underthehood.blog.51cto.com/2531780/577854

【3】:机器学习总结: 链接

 



机器学习笔记模型评估与选择

2.模型评估与选择2.1经验误差和过拟合不同学习算法及其不同参数产生的不同模型,涉及到模型选择的问题,关系到两个指标性,就是经验误差和过拟合。1)经验误差错误率(errorrate):分类错误的样本数占样本总数的比例。如果... 查看详情

机器学习——一类分类/新奇检测/异常评估?

】机器学习——一类分类/新奇检测/异常评估?【英文标题】:MachineLearning-oneclassclassification/noveltydetection/anomalyassessment?【发布时间】:2016-10-1300:41:45【问题描述】:我需要一个满足以下要求的机器学习算法:训练数据是一组特... 查看详情

机器学习中分类算法及其在乳腺癌中的预测应用代码

(一)编程实现基于SMO的非线性支持向量机算法。(二)用测试集进行验证。乳腺癌数据集分类乳腺癌数据集特征属性:1、平均半径2、平均纹理3、平均周长4、平均面积5、平均平滑度6、平均紧密度.......11、半径误差12、纹理误差1... 查看详情

机器学习模型评估指标汇总(代码片段)

在使用机器学习算法过程中,针对不同的问题需要不用的模型评估标准,这里统一汇总。主要以两大类分类与回归分别阐述。一、分类问题1、混淆矩阵混淆矩阵是监督学习中的一种可视化工具,主要用于比较分类结果和实例的... 查看详情

机器学习模型的评价指标和方法

http://blog.csdn.net/pipisorry/article/details/52574156衡量分类器的好坏    对于二类分类器/分类算法,评价指标主要有accuracy,[precision,recall,F-score,pr曲线],ROC-AUC曲线,gini系数。    对于多类分类器/分类算 查看详情

机器学习分类算法评价指标(代码片段)

一.分类评价指标对机器学习算法的性能进行评估时,不仅需要有效可行的实验估计方法,还需要有衡量模型泛化能力的评价指标,这就是算法评价指标。分类算法的评价指标一般有准确率,精确率,召回率... 查看详情

机器学习逻辑回归算法(代码片段)

逻辑回归算法学习目标1.逻辑回归的介绍1.1逻辑回归的应用场景1.2逻辑回归的原理1.2.1输入1.2.2激活函数1.3损失以及优化1.3.1损失1.3.2优化1.4小结2.逻辑回归api介绍3.案例:癌症分类预测-良/恶性乳腺癌肿瘤预测3.1背景介绍3.... 查看详情

如何解释机器学习分类算法中的得分概率?

】如何解释机器学习分类算法中的得分概率?【英文标题】:Howtointerpretscoredprobabilitiesinmachinelearningclassificationalgorithm?【发布时间】:2018-05-0310:23:19【问题描述】:我正在使用两个神经网络进行两类文本分类。我在测试数据上获... 查看详情

spark评估指标

评估指标1Classificationmodelevaluation1.1二元分类      1.1.1阈值调整1.2Multiclassclassification      1.2.1Labelbasedmetrics1.3Muitilabelclassification1.4Rankingsystems2Regressionmodelevaluation Sparkmllib自带了许多机器学习算法,它能够用来进行模型的... 查看详情

python机器学习从零开始选择模型(代码片段)

...验证。此外还可以使用新的数据来评估算法模型。在评估机器学习算法时, 查看详情

机器学习二——分类算法--决策树decisiontree

机器学习算法评估标准:准确率,速度,强壮性(噪音影响较小),可规模性,可解释性。1、决策树 DecisionTree:决策树是一个类似于流程图的树结构,其中每个内部节点表示在一个属性上的测试,每一个分支代表一个属性... 查看详情

扫一扫所有机器学习分类器?

】扫一扫所有机器学习分类器?【英文标题】:Sweepthroughallmachinelearningclassifiers?【发布时间】:2013-10-2000:56:18【问题描述】:我正在使用Weka对一些大型数据集执行分类、聚类和一些回归。我目前正在尝试所有分类器(决策树、SV... 查看详情

机器学习 - 分类器评估

】机器学习-分类器评估【英文标题】:MachineLearning-ClassifierEvaluation【发布时间】:2013-05-0807:28:20【问题描述】:一般而言,当您在训练后获得的监督学习分类器模型的准确性不符合您的预期时,您会采取哪些步骤?示例步骤:... 查看详情

机器学习具体解释knn分类的概念误差率及其问题

转载请注明出处:http://blog.csdn.net/luoshixian099/article/details/50923056勿在浮沙筑高台KNN概念    KNN(K-NearestNeighborsalgorithm)是一种非參数模型算法。在训练数据量为N的样本点中,寻找近期邻測试数据x的K个样本,然后统计... 查看详情

机器学习:logistic回归原理及其实现

Logistic回归是机器学习中非常经典的一个方法,主要用于解决二分类问题,它是多分类问题softmax的基础,而softmax在深度学习中的网络后端做为常用的分类器,接下来我们将从原理和实现来阐述该算法的思想。1.原理a.问题描述考... 查看详情

机器学习100天(十九):019分类模型评价指标-混淆矩阵

机器学习100天,今天讲的是:分类模型评价指标-混淆矩阵。《机器学习100天》完整目录:目录一、准确率(Accuracy)逻辑回归是一个分类模型,那么对于分类模型,如何评估它的优劣呢?好,我们先来认识一个名词:混淆矩阵(... 查看详情

机器学习100天(十九):019分类模型评价指标-混淆矩阵

机器学习100天,今天讲的是:分类模型评价指标-混淆矩阵。《机器学习100天》完整目录:目录一、准确率(Accuracy)逻辑回归是一个分类模型,那么对于分类模型,如何评估它的优劣呢?好,我们先来认识一个名词:混淆矩阵(... 查看详情

machinelearn机器学习及其基础概念简介

机器学习及其基础概念简介作者:白宁超2016年12月23日21:24:51摘要:随着机器学习和深度学习的热潮,各种图书层出不穷。然而多数是基础理论知识介绍,缺乏实现的深入理解。本系列文章是作者结合视频学习和书籍基础的笔记... 查看详情