2类分类的建议无监督特征选择/提取方法?

     2023-03-12     236

关键词:

【中文标题】2类分类的建议无监督特征选择/提取方法?【英文标题】:Suggested unsupervised feature selection / extraction method for 2 class classification? 【发布时间】:2016-04-30 11:00:34 【问题描述】:

我有一组 F 功能,例如实验室色彩空间,熵。通过将所有特征连接在一起,我得到了一个维度为 d 的特征向量(介于 12 到 50 之间,具体取决于选择的特征。

我通常会得到 1000 到 5000 个新样本,用 x 表示。然后用向量训练高斯混合模型,但我不知道这些特征来自哪个类。我所知道的是,只有 2 个类。根据 GMM 预测,我得到该特征向量属于第 1 类或第 2 类的概率。

我现在的问题是:如何获得最好的特征子集,例如只有熵和归一化的 rgb,这会给我最好的分类精度?我想这是可以实现的,如果由于特征子集的选择增加了类的可分离性。

也许我可以利用 Fisher 的线性判别分析?因为我已经有了从 GMM 获得的均值和协方差矩阵。但是我不是必须计算每个特征组合的分数吗?

如果这是一种没有回报的方法并且我走错了路和/或有任何其他建议,我会很高兴获得一些帮助?

【问题讨论】:

【参考方案1】:

寻找“信息丰富”特征的一种方法是使用能够最大化对数似然度的特征。您可以通过交叉验证来做到这一点。

https://www.cs.cmu.edu/~kdeng/thesis/feature.pdf

另一个想法可能是使用另一种自动选择特征的无监督算法,例如聚类森林

http://research.microsoft.com/pubs/155552/decisionForests_MSR_TR_2011_114.pdf

在这种情况下,聚类算法会根据信息增益自动拆分数据。

Fisher LDA 不会选择要素,而是将您的原始数据投影到较低维度的子空间中。如果您正在研究子空间方法 另一种有趣的方法可能是谱聚类,这也会发生 在子空间或无监督神经网络(如自动编码器)中。

希望有帮助

【讨论】:

机器学习------分类

机器学习(一)------分类机器学习分类机器学习分为监督学习和无监督学习两类。监督学习是指在有标记的样本上建立机器学习的模型(这类算法知道预测什么,即目标变量的分类信息)。无监督学习恰恰相反,是指没有标记的... 查看详情

特征选择文本挖掘

...2014-01-1113:05:07【问题描述】:我们正在完成一项关于文本分类的任务,并且我们使用了一种无监督机器学习模型。在我们进行文本聚类之前,数据集必须经过几个步骤,例如从停用词中清除它,从文本中提取词干词,然后获取特... 查看详情

维度规约(特征的提取和组合)

...参数方法——类密度模型参数估计第二部分监督学习——分类(基于似然的方法)第三部分监督学习——分类(基于判别式的方法)(参数方法——判别式参数估计)第四部分监督学习——回归第五部分监督学习——关联规则第... 查看详情

pie-basic非监督分类

功能概述 1.1遥感图像分类的概念遥感技术能够实现宏观、迅速的大范围信息提取,被各个行业广泛应用。遥感图像分类是图像信息提取的一种方法,是遥感数字图像处理的重要环节之一。遥感图像分类:根据感兴趣目标在遥... 查看详情

无监督分类——获得特征向量

】无监督分类——获得特征向量【英文标题】:Unsupervisedclassification-featurevectorsareobtained【发布时间】:2012-04-1914:25:45【问题描述】:我需要对商业产品进行分类。您知道价格比较引擎的作用。我们已经获得了特征向量。它们不... 查看详情

第2章监督学习python机器学习基础教程

第2章 监督学习2.1 分类与回归.212.2 泛化、过拟合与欠拟合.222.3 监督学习算法.242.3.1 一些样本数据集252.3.2k近邻.282.3.3 线性模型352.3.4 朴素贝叶斯分类器532.3.5 决策树542.3.6 决策树集成642.3.7 核支持向量机712.3.8 神经... 查看详情

多语言数据的特征选择和无监督学习+机器学习算法选择

...2011-07-2114:19:43【问题描述】:问题我想对数千个网站进行分类/分类/聚类/分组。有我们可以训练的数据,所以我们可以进行监督学习,但这不是我们收集的数据,我们也 查看详情

机器学习分类

...dLearning无监督学习:通过判断的数据的关键特征,来自动分类应用:图像分析计算机视觉语言分析生物监测机器控制经验科学智能健康过程:建模,训练数据集,提取关键特征方法:SVM 支持向量机Neuralnetworks神经网络NaiveBayes... 查看详情

特征选取--卡方选择器

...和“无关”的特征,提升学习器的性能。特征选择方法和分类方法一样,也主要分为有监督(Supervised)和无监督(Unsupervised)两种,卡方选择则是统计学上常用的一种有监督特征选择方法,它通过对特征和真实标签之间进行卡 查看详情

有监督学习和无监督学习的区别

...有label,主要是学习得到一个特征空间到label的映射,如分类、回归等无监督学习的训练样本没有label,主要是发现样本的内部结构,如聚类、降维、可视化等参考技术A1、机器学习按照方法来分类,可以分成四类,分别是:监督... 查看详情

聚类算法(无监督学习)

聚类1、聚类概述1.1什么是聚类1.2分类与聚类1.3聚类的应用2、基本的聚类方法2.1划分方法2.1.1划分方法概述2.1.2K-Means算法2.1.3K-means计算实例2.1.4K-means改进算法2.2层次方法2.1.1层次方法概述3、基于密度的方法3.1相关概念4、聚类评估4... 查看详情

机器学习应用——无监督学习(实例:31省市居民家庭消费调查&学生上网时间分布聚类&鸢尾花数据&人脸数据特征提取)(代码片段)

...应用博客中,将核心介绍三大类学习,即:无监督学习、监督学习、强化学习。本篇将简要介绍:1.无监督学习概念(最常应用场景:聚类(clustering)和降维(DimensionReduction))2.聚类——kmeans方法(居... 查看详情

机器学习基本概念

...数据的参数来预测并解释新的观测数据。2、机器学习的分类  机器学习一般可以分为两类:有监督学习(supervisedlearning)和无监督学习(unsupervisedlearning)。  2.1有监督学习    有监督学习是指对数据的若干特征与若... 查看详情

有监督学习无监督学习半监督学习

...问题时,往往也可以正确地解决。有监督学习分为两类:分类或回归。2.无监督学习:计算机 查看详情

中文关键词提取算法(代码片段)

...解决思路:有监督方法,把关键词提取问题当做分类问题,文本分词后标记各词的重要性打分,然后挑出重要的topK个词;无监督方法,使用TextRank、TFIDF等统计算法区分各词的termweight,然后按weight排序... 查看详情

分类与监督学习,朴素贝叶斯分类算法

1、简述分类与聚类的联系与区别。简述什么是监督学习与无监督学习。分类与聚类:分类是一种有监督的算法,是在已经有目标分类的情况下对数据进行类别判断(朴素贝叶斯算法)。而聚类是一种无监督算法,是在建立模型... 查看详情

11.分类与监督学习,朴素贝叶斯分类算法

1.理解分类与监督学习、聚类与无监督学习。简述分类与聚类的联系与区别。简述什么是监督学习与无监督学习。 答: (1)分类与聚类:   分类简单来说,就是根据文本的特征或属性,划分到已有的类别中。也就是说... 查看详情

无监督学习聚类一维数组

...我已经检查了很多关于这个主题的堆栈问题,其中大多数建议 查看详情