关键词:
判别与聚类的比较:
聚类分析和判别分析有相似的作用,都是起到分类的作用。
判别分析是已知分类然后总结出判别规则,是一种有指导的学习;
聚类分析则是有了一批样本,不知道它们的分类,甚至连分成几类也不知道,希望用某种方法把观测进行合理的分类,使得同一类的观测比较接近,不同类的观测相差较多,这是无指导的学习。
所以,聚类分析依赖于对观测间的接近程度(距离)或相似程度的理解,定义不同的距离量度和相似性量度就可以产生不同的聚类结果
判别分析
基本原理:从已知的各种分类情况中总结规律(训练出判别函数),当新样品进入时,判断其与判别函数之间的相似程度(概率最大,距离最近,离差最小等判别准则)。
常用判别方法:最大似然法,距离判别法,Fisher判别法,Bayes判别法,逐步判别法等。
注意事项:1. 判别分析的基本条件:分组类型在两组以上,解释变量必须是可测的;
2. 每个解释变量不能是其它解释变量的线性组合(比如出现多重共线性情况时,判别权重会出现问题);
3. 各解释变量之间服从多元正态分布(不符合时,可使用Logistic回归替代),且各组解释变量的协方差矩阵相等(各组协方方差矩阵有显著差异时,判别函数不相同)。
相对而言,即使判别函数违反上述适用条件,也很稳健,对结果影响不大。
应用领域:对客户进行信用预测,寻找潜在客户(是否为消费者,公司是否成功,学生是否被录用等等),临床上用于鉴别诊断。
参考文献:
https://blog.csdn.net/zhubo22/article/details/8194772 总述 聚类与判别之间的关系
r语言应用实战-基于r语言的判别分析:fisher判别法,距离判别法以及bayers判别法(附源代码)
前言判别分析(DiscriminatAnalysis)是多变量统计分析中用于判别样本所属类型的一种统计分析法。它所要解决的问题是在一些已知研究对象用某种方法已经分成若干类的情况下确定新的样本属于已知类别的哪一类。判别分析在处理... 查看详情
R中线性判别分析中的分类函数
】R中线性判别分析中的分类函数【英文标题】:ClassificationfunctionsinlineardiscriminantanalysisinR【发布时间】:2011-08-0312:38:33【问题描述】:在R中使用lda()完成线性判别分析后,是否有一种方便的方法可以为每个组提取classificationfuncti... 查看详情
如何在 R 中的线性判别分析图上绘制分类边界
】如何在R中的线性判别分析图上绘制分类边界【英文标题】:HowtoplotclassificationbordersonanLinearDiscriminationAnalysisplotinR【发布时间】:2015-08-1715:14:09【问题描述】:我使用线性判别分析(LDA)来研究一组变量在3个组之间的区分程度。... 查看详情
r:聚类分析
判别与聚类的比较:聚类分析和判别分析有相似的作用,都是起到分类的作用。判别分析是已知分类然后总结出判别规则,是一种有指导的学习;聚类分析则是有了一批样本,不知道它们的分类,甚至连分成几类也不知道,希望... 查看详情
线性判别分析(lda),二次判别分析(qda)和正则判别分析(rda)(代码片段)
判别分析包括可用于分类和降维的方法。线性判别分析(LDA)特别受欢迎,因为它既是分类器又是降维技术。二次判别分析(QDA)是LDA的变体,允许数据的非线性分离。最后,正则化判别分析(RDA)是LDA和QDA之间的折衷。本文主... 查看详情
r语言logistic回归判别分析(lda)多元自适应样条回归mars分析案例:分析乳腺癌数据集明确细针穿刺肿瘤活检结果
R语言logistic回归、判别分析(LDA)、多元自适应样条回归MARS分析案例:分析乳腺癌数据集明确细针穿刺肿瘤活检结果目录 查看详情
r语言使用caret包的featureplot函数可视化变量的重要性通过分组数据分布差异查看变量对于预测目标变量的判别性通过可视化密度图进行判别分析
R语言使用caret包的featurePlot函数可视化变量的重要性、通过分组数据分布差异查看变量对于预测目标变量的判别性、通过可视化密度图进行判别分析目录 查看详情
r语言使用caret包的featureplot函数可视化变量的重要性通过分组数据分布差异查看变量对于预测目标变量的判别性通过可视化密度图进行判别分析
R语言使用caret包的featurePlot函数可视化变量的重要性、通过分组数据分布差异查看变量对于预测目标变量的判别性、通过可视化密度图进行判别分析目录 查看详情
r语言使用caret包的featureplot函数可视化变量的重要性通过分组数据分布差异查看变量对于预测目标变量的判别性通过可视化箱图进行判别分析
R语言使用caret包的featurePlot函数可视化变量的重要性、通过分组数据分布差异查看变量对于预测目标变量的判别性、通过可视化箱图进行判别分析目录 查看详情
r语言中多分类问题multicalssclassification的性能测量(代码片段)
判别分析包括可用于分类和降维的方法。线性判别分析(LDA)特别受欢迎,因为它既是分类器又是降维技术。二次判别分析(QDA)是LDA的变体,允许数据的非线性分离。最后,正则化判别分析(RDA)是LDA和QDA之间的折衷。本文主... 查看详情
再现Fisher线性判别图
】再现Fisher线性判别图【英文标题】:ReproduceFisherlineardiscriminantfigure【发布时间】:2016-02-2323:23:38【问题描述】:许多书籍都使用下图说明了Fisher线性判别分析的思想(此图来自PatternRecognitionandMachineLearning,第188页)我想知道如... 查看详情
降维技术2-线性判别分析(lda)
线性判别分析(LinearDiscriminantAnalysis),简称LDA,是一种经典的线性学习方法。在二分类问题上最早由Fisher提出,也称"Fisher判别分析"。在主成分分析原理总结中,我们对降维算法PCA进行了总结。这里的LDA是另一种经典的的降... 查看详情
关于判别分析的理解
判别分析又称“分辨法”,是在分类确定的条件下,根据某一研究对象的各种特征值判别其类型归属问题的一种多变量统计分析方法。其基本原理是按照一定的判别准则,建立一个或多个判别函数,用研究对象的大... 查看详情
r统计距离判别bayes判别和finsher判别(代码片段)
...2.0,试问预报明天下雨还是预报明天不下雨?分别用距离判别、Bayes判别(考虑方差相同和方差不同两种情况)和Fisher判别来得到你所需要的结论。数据:雨天非雨天X1(湿度差)X2(压温差)X1(湿度差)X2((压温差)-1.93.20.20.2-6. 查看详情
线性判别分析之python代码分析(代码片段)
...下机器学习的相关理论,主要介绍了感知机,SVM以及线性判别分析。现在用代码来实现一下其中的模型,一方面对存粹理论的理解,另一方面也提升一下代码的能力。本文就先从线性判别分析开始讲起,不熟悉的可以先移步至线... 查看详情
lda线性判别分析
...blog.csdn.net/porly/article/details/8020696 1. LDA是什么线性判别式分析(LinearDiscriminantAnalysis),简称为LDA。也称为Fisher线性判别(FisherLinearDiscriminant,FLD),是模式识别的经典算法,在1996年由Belhumeur引入模式识别和人工智能领域... 查看详情
fisher判别方法的主要特点是
参考技术Afisher判别方法的主要特点是先对数据进行投影然后再利用距离进行判别。Fisher判别法是判别分析的方法之一,它是借助于方差分析的思想,利用已知各总体抽取的样品的p维观察值构造一个或多个线性判别函数y=l′x其中... 查看详情
lda线性判别式分析
1. LDA是什么 线性判别式分析(LinearDiscriminantAnalysis),简称为LDA。也称为Fisher线性判别(FisherLinearDiscriminant,FLD),是模式识别的经典算法,在1996年由Belhumeur引入模式识别和人工智能领域。 基本思... 查看详情