为空值的 K-最近邻插补安装 Python Fancy Impute 模块

     2023-02-23     125

关键词:

【中文标题】为空值的 K-最近邻插补安装 Python Fancy Impute 模块【英文标题】:Installing Python Fancy Impute Module for K-Nearest Neighbors Imputation of Null Values 【发布时间】:2016-04-28 10:45:03 【问题描述】:

我使用的是 64 位 Windows 10 机器。

我正在尝试安装 fancy impute module 来对数据集中的空值进行 K-Nearest Neighbors Imputation。

我不得不单独安装cvxopt

conda install -c https://conda.binstar.org/eswears cvxopt

和 Keras 使用

pip install keras

当我从命令提示符写入 python 时

[Anaconda2] C:\Users\path>python
>>> import fancyimpute

我收到以下错误(我已截断错误消息,但可以根据要求显示完整错误)

Using Theano backend.
WARNING (theano.configdefaults): g++ not detected...
'g++' is not recognized as an internal or external command...

编辑 为了解决这个问题,我下载了 MinGW 并按照here 的说明进行操作,但仍然收到同样的错误。

我的问题是:

(1) 是否有其他方法可以解决我收到的错误消息?

(2) 是否有一个 python 模块也可以对空值进行 K-Nearest Neighbors Imputation?

【问题讨论】:

报错说明你没有g++,可以用MinGW安装-mingw.org/wiki/howto_install_the_mingw_gcc_compiler_suite 我已经安装了 MinGW 并按照问题中包含的链接中的说明进行操作。如果不清楚,请道歉。我将编辑我的问题以突出显示 【参考方案1】:

你必须在库“ecos”之前安装。

如果导入ecos库有问题,只需从网站下载对应PC配置的ecos包:“http://www.lfd.uci.edu/~gohlke/pythonlibs” 然后,在终端的下载地址输入: "点安装 ecos‑2.0.4‑cp35‑cp35m‑win_amd64.whl"

祝你好运

【讨论】:

【参考方案2】:

是否存在超出 g++ 警告的错误?我可能错了,但我的印象是 Theano 在没有编译器的情况下会默认使用较慢的实现。自从fancyimpute的。 KNN 实现实际上并没有使用 Theano,那么您应该仍然可以使用该库的那部分。

【讨论】:

机器学习100天(三十):030k近邻分类算法-k值的选择(代码片段)

机器学习100天,今天讲的是:K近邻分类算法-K值的选择。《机器学习100天》完整目录:目录上一节我们讲了K折交叉验证的理论,下面我们将K折交叉验证算法应用到K近邻分类算法中,用来选择最合适的超参数K值。数据集iris_data.c... 查看详情

机器学习100天(三十):030k近邻分类算法-k值的选择(代码片段)

机器学习100天,今天讲的是:K近邻分类算法-K值的选择。《机器学习100天》完整目录:目录上一节我们讲了K折交叉验证的理论,下面我们将K折交叉验证算法应用到K近邻分类算法中,用来选择最合适的超参数K值。数据集iris_data.c... 查看详情

k-近邻算法(代码片段)

... 以下是常用的欧式距离公式:    3.2.k个实例中个k值的大小如何选择。  一般而言,k值的大小对分类结果有着重大的影响。当选择的k值较小的情况下,就相当于用较小的邻域中的训练实例进行预测,只有当与输入实例... 查看详情

单元无回答的缺失数据处理方法

...具有很好的分类精度,从而也更进一步确保了得到的填补值的准确性和可靠性。 查看详情

python,opencv中的k近邻(knnk-nearestneighbor)及改进版的k近邻(代码片段)

Python,OpenCV中的K近邻(knnK-NearestNeighbor)及改进版的K近邻1.效果图2.源码参考这篇博客将介绍将K-最近邻(KNNK-NearestNeighbor)算法及改进版的K近邻,并演示如何根据K近邻进行简单的分类;KNN是可用于监督学习的最... 查看详情

用python.检查“影片名称”字段为空值的+数据,给该字段填充数+据"unnamed"?

...字典。对于每个字典,检查其"影片名称"字段是否为空值。如果字段为空值,则将字段的值设置为“unnamed”。例如,可以使用以下代码实现上述步骤:#读取数据,并将数据存储在`data`变量中#遍历列表中的每个字典forrecord... 查看详情

K-最近邻分类的“概率”

】K-最近邻分类的“概率”【英文标题】:\'Probability\'ofaK-nearestneighborlikeclassification【发布时间】:2011-06-2311:34:03【问题描述】:我在2D空间中有一小部分数据点(大约10个),每个数据点都有一个类别标签。我希望根据现有数据... 查看详情

k近邻算法(knn)与k-means算法的对比

...多数属于某一类,则该样本也属于这一类。影响因素:k值的选择。k的值小,则近似误差小,估计误差大;k的值大,则近似误差大,估计误差小。(近似误差即算法在训练集上的误差,估计误差即算法在测试集上的误差。近似误... 查看详情

机器学习算法之knn最近邻详解和python实现(代码片段)

...f0c;非商业转载请注明出处目录概念KNN相关的三个事情 1.K值的确定2.距离的度量计算距离注意一定要做数据缩放:归一化和标准化3.分类判别的方式方案算法基本步骤:算法python实现优缺点优点缺点 概念        KNN&#x 查看详情

matlab中的k最近邻分类器

】matlab中的k最近邻分类器【英文标题】:k-nearest-neighborclassifierinmatlab【发布时间】:2011-12-3013:20:51【问题描述】:我对k-最近邻分类器算法完全陌生。有人可以给我一个链接到一个很好的教程/讲座,它提供了一个数据集,以便... 查看详情

k-近邻(knn)算法

  K-近邻算法(K-NN)  邻近算法,或者说K最近邻(kNN,k-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一。所谓K最近邻,就是k个最近的邻居的意思,说的是每个样本都可以用它最接近的k个邻居来代表。  kNN... 查看详情

统计学习三:2.k近邻法代码实现(以最近邻法为例)(代码片段)

通过上文可知感知机模型的基本原理,以及算法的具体流程。本文实现了感知机模型算法的原始形式,通过对算法的具体实现,我们可以对算法有进一步的了解。具体代码可以在我的github上查看。代码#!/usr/bin/python3#-*-coding:utf-8-*... 查看详情

Scikit Learn 中的 K-最近邻

】ScikitLearn中的K-最近邻【英文标题】:K-NearestNeighborinSci-KitLearn【发布时间】:2021-11-0413:19:15【问题描述】:我正在尝试使用Sci-KitLearn练习使用Iris数据集进行K-NearestNeighbor预测模型。这是我写的:importsklearnfromsklearnimportdatasetsfroms... 查看详情

10-k最近邻算法

本章内容:学习使用K最近邻算法创建分类系统学习特征抽取学习回归,即预测数值,如明天的股价或用户对某部电影对喜欢程度学习K最近邻算法的应用案例和局限性1.橙子还是柚子猜这个水果是柚子,还是橙子?如果又红又大... 查看详情

k近邻算法

定义K最近邻(k-NearestNeighbor,KNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则... 查看详情

k近邻法

简介k近邻法(k-nearestneighborsalgorigthm)是一种最基本的用于分类和回归的方法之一,当没有关于训练数据的分布时,首先最容易想到的就是采用k近邻法。k近邻法输入为实例的特征向量,输出为实例的类别。算法思想是,给定训练数... 查看详情

显示 k 个最近邻用于文本分类

】显示k个最近邻用于文本分类【英文标题】:Showknearestneighborsfortextclassification【发布时间】:2020-05-1408:54:04【问题描述】:我在语料库中有一个CSV文件(corpus.csv),其中包含以下格式的分级摘要(文本):Institute,Score,Abstract--------... 查看详情

如何在 Matlab 中进行高效的 k 最近邻计算

】如何在Matlab中进行高效的k最近邻计算【英文标题】:Howtodoefficientk-nearestneighborcalculationinMatlab【发布时间】:2014-08-0810:31:42【问题描述】:我正在使用Matlab中的k-最近邻算法进行数据分析。我的数据由大约11795x88数据矩阵组成,... 查看详情