关键词:
更新、更全的《机器学习》的更新网站,更有python、go、数据结构与算法、爬虫、人工智能教学等着你:https://www.cnblogs.com/nickchen121/
决策树总结
一、ID3算法、C4.5算法和CART算法比较
算法 | 树结构 | 支持模型 | 特征选择 | 连续值处理 | 缺失值处理 | 剪枝 |
---|---|---|---|---|---|---|
ID3 | 分类 | 多叉树 | 信息增益 | 不支持 | 不支持 | 不支持 |
C4.5 | 分类 | 多叉树 | 信息增益比 | 支持 | 支持 | 支持 |
CART | 分类、回归 | 二叉树 | 基尼指数、均方差 | 支持 | 支持 | 支持 |
二、决策树优缺点
2.1 优点
- 简单明了,生成的决策树很直观,在逻辑上可以得到很好的解释,属于白盒模型。
- 通常情况下不需要进行数据预处理。
- 使用决策树预测的代价是(O(log_2m)quad extm为样本数)。
- 很多算法只是专注于离散值或者连续值,而决策树既可以处理离散值也可以处理连续值。
- 可以处理多维度样本的分类问题。
- 可以使用交叉验证的剪枝方法来选择模型,很大程度的提高了泛化能力。
- 对于敏感点的容错能力强。
2.2 缺点
- 决策树算法非常容易过拟合,进而导致泛化能力不强。(可以通过设置节点最少样本数量和限制决策树层数来改进)
- 决策树会因为样本发生一点的改动,进而导致树结构发生剧烈变化。(可以使用集成学习生成随机森林、Xgboost等方法改善)
- 通常情况下通过启发式方法寻找最优的决策树,但由于该问题是一个NP难的问题,所以很容易得到局部最优解。(可以使用集成学习生成随机森林、Xgboost等方法改善)
- 决策树很难学习比较复杂的关系,例如异或。(通常换个分类器解决该类问题,例如使用神经网络分类)
- 决策树容易偏向于征样本比例偏大的特征。(可以适度的调节样本的权重)
决策树分类算法小结
引言 本文主要是对分类型决策树的一个总结。在分类问题中,决策树可以被看做是if-then规则的结合,也可以认为是在特定特征空间与类空间上的条件概率分布。决策树学习主要分为三个步骤:特征选择、决策树的生成与剪... 查看详情
机器学习总结决策树id3,c4.5算法,cart算法
本文主要总结决策树中的ID3,C4.5和CART算法,各种算法的特点,并对比了各种算法的不同点。决策树:是一种基本的分类和回归方法。在分类问题中,是基于特征对实例进行分类。既可以认为是if-then规则的集合,也可以认为是定... 查看详情
决策树算法原理
...好,就拿来主义了,不顾以后还是多像楼主学习) 决策树算法在机器学习中算是很经典的一个算法系列了。它既可以作为分类算法,也可以作为回归算法,同时也特别适合集成学习比如随机森林。本文就对决策树算法原理... 查看详情
决策树算法
决策树算法在机器学习中算是很经典的一个算法系列了。它既可以作为分类算法,也可以作为回归算法,同时也特别适合集成学习比如随机森林。本文就对决策树算法原理做一个总结,上篇对ID3,C4.5的算法思想做了总结,下... 查看详情
机器学习系列(三十六)——回归决策树与决策树总结
参考技术A回归决策树树是用于回归的决策树模型,回归决策树主要指CART算法,同样也为二叉树结构。以两个特征预测输出的回归问题为例,回归树的原理是将特征平面划分成若干单元,每一个划分单元都对应一个特定的输出。... 查看详情
决策树算法总结
...lS6vZ3LCnczWD0w前言李航老师《统计学习方法》详细的描述了决策树的生成和剪枝。根据书的内容,做总结如下。 目录决策树不确定性的度量方法决策树的特征筛选准则决策函数的损失函数评估决策树最优模型的构建步骤决策树... 查看详情
《机器学习实战》-决策树(代码片段)
目录决策树决策树简介决策树的构造信息增益划分数据集递归构建决策树在Python中使用Matplotlib注解绘制树形图Matplotlib注解构造注解树测试和存储分类器测试算法:使用决策树执行分类使用算法:决策树的存储示例:使用决策树... 查看详情
决策树随机森林baggingboostingadaboostgbdtxgboost总结
...5468124最近还在深化机器学习算法,所以分享一篇关于决策树的总结文章,从普通的决策树到集成学习随机森林、GBDT、XGBoost,总结的还是非常到位的。一.决策树决策树是一个有监督分类模型,本质是选择一个最大... 查看详情
决策树随机森林baggingboostingadaboostgbdtxgboost总结
...5468124最近还在深化机器学习算法,所以分享一篇关于决策树的总结文章,从普通的决策树到集成学习随机森林、GBDT、XGBoost,总结的还是非常到位的。一.决策树决策树是一个有监督分类模型,本质是选择一个最大... 查看详情
构建决策树
构建决策树决策树信息熵划分基尼系数划分调用CART 决策树决策树,是通过数据归纳,总结出条件判断的学习模式。如果新来一位男生/客户/面试者,根据上面的树状图就可以作出是否见面/贷款/入职的决定,所以... 查看详情
决策树生成算法
关于决策树,想必大部分人都已经耳熟能详了,这是一种用来预测行为的树状分叉结构。本文主要想总结一下最常用的决策树生成算法构造的原则熟悉决策树的你一定记得,决策树每个非叶子结点对应的其实是一个属性。比方说... 查看详情
sklearn决策树
决策树的原理很简单:一颗由多个判断节点组成的树。因为其应用之广,也有许许多多的衍生(RandomForest,GBDT,XGBOOST)。我想确实很有必要做一个总结。决策树的一些优点是:简单理解和解释。树可以被可视化。需要很少的数据... 查看详情
笔记︱决策树族——梯度提升树(gbdt)
笔记︱决策树族——梯度提升树(GBDT)本笔记来源于CDADSC,L2-R语言课程所学进行的总结。 一、介绍:梯度提升树(GradientBoostDecisionTree)Boosting算法和树模型的结合。按次序建立多棵树,每棵树都是为了减少上一次的残差... 查看详情
决策树系列算法总结(id3,c4.5,cart,randomforest,gbdt)
...,如果不想使用多层的神经网络做分类的话,用决策树系列的算法就是不错的选择。注:这里 查看详情
机器学习决策树理论第二卷
决策树内容来至于《统计学习与方法》李航,《机器学习》周志华,以及《机器学习实战》PeterHarringTon,相互学习,不足之处请大家多多指教!本卷的大纲为1CART算法1.1CART回归树1.2CART分类树2CART剪枝3总结1CART算法CART分类与回归树(classi... 查看详情
机器学习实战基础(二十八):决策树概述(代码片段)
概述决策树是如何工作的 决策树(DecisionTree)是一种非参数的有监督学习方法,它能够从一系列有特征和标签的数据中总结出决策规则,并用树状图的结构来呈现这些规则,以解决分类和回归问题。决策树算法容易理解,适... 查看详情
学习笔记|机器学习决策树
...值处理五、总结通过这篇博客,您将收获如下知识:熟悉决策树相关的基础知识:自信息、信息熵与条件熵,信息增益和增益率,Gini值和Gini指数。熟悉决策树算法的关键原理,模型、策略与优化算法。了解决策树中过拟合问题... 查看详情
学习笔记|机器学习决策树
...值处理五、总结通过这篇博客,您将收获如下知识:熟悉决策树相关的基础知识:自信息、信息熵与条件熵,信息增益和增益率,Gini值和Gini指数。熟悉决策树算法的关键原理,模型、策略与优化算法。了解决策树中过拟合问题... 查看详情