通过knn算法,确定球星的风格(很水)

yushangcc yushangcc     2022-08-26     487

关键词:

KNN算法,故名思议,K个最邻近值的分类算法。监督学习中的一种,典型的懒人算法,通过计算所有的预测样本到学习样本的距离,选取其中K个最小值加入样本组中,样本组中的样本隶属于那个分类的个数最多,那么我们就预测我们的预测样本是属于这个类型的。

学习来源某个pdf(别人的学习笔记):

第四章 KNN(k最邻近分类算法) 最邻近分类算法) 最邻近分类算法) 最邻近分类算法) 最邻近分类算法) 最邻近分类算法) 最邻近分类算法) 最邻近分类算法)
1.算法 思路
通过计算每个训练样例到待分类品的 距离,取和最近K个训练 样例, K个 样品中哪个类别
的训练例占多数,则待分就属于核心思想: 如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。该方法在确定分类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。 kNN方法在类别决策时,只与极少量的相邻样本有关。由于kNN方法主要靠周围有限的邻近的样本,而不是靠判别类域的方法来确定所属类别的,因此对于类域的交叉或重叠较多的待分样本集来说,kNN方法较其他方法更为适合。
2.算法描述 1. 算距离 :给定测试对象,计它与训练集中的每个依公式计算 Item 与 D1、D2 … …、Dj 之相似度。得到Sim(Item, D1)、Sim(Item, D2)… …、Sim(Item, Dj)。 2. 将Sim(Item, D1)、Sim(Item, D2)… …、Sim(Item, Dj)排序,若是超过相似度阈值t则放入邻居案例集合NN。 找邻居:圈定距离最近的k个训练对象,作为测试对象的近邻 3. 自邻居案例集合NN中取出前k名,依多数决,得到Item可能类别。 做分类:根据这k个近邻归属的主要类别,来对测试对象分类
3.算法步骤
• step.1---初始化距离为最大值 初始化距离为最大值
• step.2---计算未知样本和每个训练的距离 计算未知样本和每个训练的距离 dist
• step.3---得到目前 得到目前 K个最临近样本中的大距离 maxdist
• step.4---如果 dist小于 maxdist,则将该训练样本作为 K-最近邻样本
• step.5---重复步骤 重复步骤 2、3、4,直到未知样本和所有训练的距离都算完
• step.6---统计 K-最近邻样本中每个类标号出现的次数
• step.7---选择出现频率最大的类标号 作为未知样本选择出现频率最大的类标号
作为未知样本该算法涉及 3个主要因素: 训练集、 距离或相似的衡量训练集、 距离或相似的衡量训练集、 距离或相似的衡量训练集、 距离或相似的衡量训练集、 距离或相似的衡量训练集、 距离或相似的衡量训练集、 距离或相似的衡量训练集、 距离或相似的衡量训练集、 距离或相似的衡量训练集、 距离或相似的衡量训练集、 距离或相似的衡量k的大小。 的大小。 的大小。
4. k邻近模型三个基本要素 邻近模型三个基本要素 邻近模型三个基本要素 邻近模型三个基本要素 邻近模型三个基本要素 邻近模型三个基本要素 邻近模型三个基本要素 邻近模型三个基本要素
三个基本要素为 距离度量、 距离度量、 距离度量、 距离度量、 k值的选择和分类决策规则 值的选择和分类决策规则 值的选择和分类决策规则 值的选择和分类决策规则 值的选择和分类决策规则 值的选择和分类决策规则 值的选择和分类决策规则 值的选择和分类决策规则 值的选择和分类决策规则
距离度量:
设特征空间 χ是 n维实数向量空间 

r语言学习-knn临近算法

...函数,根据这个函数为所有数据标注。 KNN分类算法:通过对已知类别训练数据集的分析,从中发现分类规则,以此预测新数据的类别,分类算法属于监督学习的类型。KNN概念:  1、训练集:用来训练模型或确定模型参数... 查看详情

class-k近邻算法knn

...类时,对新的实例根据其k个最近邻训练集实例的类别,通过多数表决的方式进行预测。不具有显式学 查看详情

k近邻算法——knn(代码片段)

...特殊的是它不需要训练,易于理解,易于实现。在KNN中,通过计算对象间距离来作为各个对象之间的相似性指标,在这里距离一般使用欧氏距 查看详情

id3和knn

...果遇到连续值需离散处理,以香农熵作为信息获取度量,通过计算特征的信息熵增益来确定一个个的根节点退出条件如下:1、标记属性一致  2、无可再分属性,这时就投票决定缺点:对于连续值的处理效果比较差 KNN:以&... 查看详情

knn算法及knn的优化算法-加权knn(代码片段)

KNN及加权KNN优化算法深度学习的常规套路:1.收集数据并给定标签2.训练一个分类器3.测试,评估K-近邻(KNN)算法:对于未知类别属性数据集中的点:1.计算已知类别数据集中的点与当前点的距离2.按照距离依次排序3.... 查看详情

一句话总结knn算法

 一句话总结kNN算法 核心:模板匹配,将样本分到离它最相似的样本所属的类。 kNN算法本质上使用了模板匹配的思想。要确定一个样本的类别,可以计算它与所有训练样本的距离,然后找出和该样本最接近的k个样本... 查看详情

机器学习knn算法实现手写板字迹识别(代码片段)

...机器学习】KNN算法实现手写板字迹识别1.前言​上篇博客通过KNN算法实现鸢尾花数据集分类,在博客最后对KNN算法是否适合于图像分类进行了讨论。本篇博客通过KNN算法实现手写板字迹识别,通过人机交互的模 查看详情

k-近邻(knn)算法

  K-近邻算法(K-NN)  邻近算法,或者说K最近邻(kNN,k-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一。所谓K最近邻,就是k个最近的邻居的意思,说的是每个样本都可以用它最接近的k个邻居来代表。  kNN... 查看详情

r语言-knn算法

...适合。3、KNN算法不仅可以用于分类,还可以用于回归。通过找出一个样本的k个最近邻居,将这些邻居的属性的平均值赋给该样本,就可以得到该样本的属性。更有用的方法是将不同距离的邻居对该样本产生的影响给予不同的权... 查看详情

knn是啥意思

参考技术Aknn是邻近算法,或者说K最邻近分类算法,全称为K-NearestNeighbor,是数据挖掘分类技术中最简单的方法之一。所谓K最近邻,是K个最近的邻居的意思,说的是每个样本都可以用最接近的K个邻近值来代表。近邻算法是将数... 查看详情

机器学习-knn算法(代码片段)

...也是最常用的分类算法之一。在接下来的内容中,将通过以下的几个方面的内容对该算法进行详细的讲解:算法思想思想首先对KNN 查看详情

knn分类算法补充

KNN补充:1、K值设定为多大?k太小,分类结果易受噪声点影响;k太大,近邻中又可能包含太多的其它类别的点。(对距离加权,可以降低k值设定的影响)k值通常是采用交叉检验来确定(以k=1为基准)经验规则:k一般低于训练... 查看详情

knn算法的实现(代码片段)

K近邻(KNN)算法简介  KNN是通过测量不同特征值之间的距离进行分类。它的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别,其中K通常是不... 查看详情

matlab中的KNN算法

...法来对我的图像进行分类。根据this,它只有2个测量值,通过它计算找到最近邻居的距离,但在我的例子中,我有400张25X42的图像,其中200张用于训练,200张用于测试。我正在寻找几个小时,但我没有找到找到点之间距离的方法... 查看详情

tensorflow实现knn(k近邻)算法

首先先介绍一下knn的基本原理:KNN是通过计算不同特征值之间的距离进行分类。整体的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。K通常... 查看详情

数据挖掘之分类算法---knn算法(有matlab样例)

...同,knn算法是一种懒惰算法.它并不是像其它的分类算法先通过训练建立分类模型.,而是一种被动的分类过程.它是边測试边训练建立分类模型.算法的一般描写叙述步骤例如以下:1.首先计算每一个測试样本点到其它每一个点的距离.... 查看详情

数据分析第十篇:分类(knn)(代码片段)

...地说,对于给定的测试样本和基于某种度量距离的方式,通过最靠近的k个训练样本来预测当前样本的分类结果。例如,借用百度的一张图来说明kNN算法过程,要预测图中Xu的分类结果,先预设一个距离值,只考虑以Xu为圆心以这... 查看详情

knn准确率一般在多少以上为准

参考技术A作为一种非参数的分类算法,K-近邻(KNN)算法是非常有效和容易实现的。它已经广泛应用于分类、回归和模式识别等。在应用KNN算法解决问题的时候,要注意两个方面的问题--样本权重和特征权重。利用SVM来确定特征的... 查看详情