机器学习入门之四:机器学习的方法--其它算法(转载)

shaomine shaomine     2022-09-08     697

关键词:

  转自 飞鸟各投林

  

  4、聚类算法

 

  前面的算法中的一个显著特征就是我的训练数据中包含了标签,训练出的模型可以对其他未知数据预测标签。在下面的算法中,训练数据都是不含标签的,而算法的目的则是通过训练,推测出这些数据的标签。

这类算法有一个统称,即无监督算法(前面有标签的数据的算法则是有监督算法)。无监督算法中最典型的代表就是聚类算法。

 

  让我们还是拿一个二维的数据来说,某一个数据包含两个特征。我希望通过聚类算法,给他们中不同的种类打上标签,我该怎么做呢?简单来说,聚类算法就是计算种群中的距离,根据距离的远近将数据划分为多个族群。

 

  聚类算法中最典型的代表就是K-Means算法。

 

  5、降维算法

 

  降维算法也是一种无监督学习算法,其主要特征是将数据从高维降低到低维层次。在这里,维度其实表示的是数据的特征量的大小,例如,房价包含房子的长、宽、面积与房间数量四个特征,也就是维度为4维的数据。

可以看出来,长与宽事实上与面积表示的信息重叠了,例如面积=长 × 宽。通过降维算法我们就可以去除冗余信息,将特征减少为面积与房间数量两个特征,即从4维的数据压缩到2维。于是我们将数据从高维降低到低维,

不仅利于表示,同时在计算上也能带来加速。

 

  刚才说的降维过程中减少的维度属于肉眼可视的层次,同时压缩也不会带来信息的损失(因为信息冗余了)。如果肉眼不可视,或者没有冗余的特征,降维算法也能工作,不过这样会带来一些信息的损失。但是,

降维算法可以从数学上证明,从高维压缩到的低维中最大程度地保留了数据的信息。因此,使用降维算法仍然有很多的好处。

 

  降维算法的主要作用是压缩数据与提升机器学习其他算法的效率。通过降维算法,可以将具有几千个特征的数据压缩至若干个特征。另外,降维算法的另一个好处是数据的可视化,例如将5维的数据压缩至2维,

然后可以用二维平面来可视。降维算法的主要代表是PCA算法(即主成分分析算法)。

 

  6、推荐算法

 

  推荐算法是目前业界非常火的一种算法,在电商界,如亚马逊,天猫,京东等得到了广泛的运用。推荐算法的主要特征就是可以自动向用户推荐他们最感兴趣的东西,从而增加购买率,提升效益。推荐算法有两个主要的类别:

 

  一类是基于物品内容的推荐,是将与用户购买的内容近似的物品推荐给用户,这样的前提是每个物品都得有若干个标签,因此才可以找出与用户购买物品类似的物品,这样推荐的好处是关联程度较大,但是由于每个物品都需要贴标签,因此工作量较大。

 

  另一类是基于用户相似度的推荐,则是将与目标用户兴趣相同的其他用户购买的东西推荐给目标用户,例如小A历史上买了物品B和C,经过算法分析,发现另一个与小A近似的用户小D购买了物品E,于是将物品E推荐给小A。

 

  两类推荐都有各自的优缺点,在一般的电商应用中,一般是两类混合使用。推荐算法中最有名的算法就是协同过滤算法。

 

  7、其他

 

  除了以上算法之外,机器学习界还有其他的如高斯判别,朴素贝叶斯,决策树等等算法。但是上面列的六个算法是使用最多,影响最广,种类最全的典型。机器学习界的一个特色就是算法众多,发展百花齐放。

 

  下面做一个总结,按照训练的数据有无标签,可以将上面算法分为监督学习算法和无监督学习算法,但推荐算法较为特殊,既不属于监督学习,也不属于非监督学习,是单独的一类。

 

  监督学习算法:


  线性回归,逻辑回归,神经网络,SVM

 

  无监督学习算法:


  聚类算法,降维算法

 

  特殊算法:


  推荐算法

 

  除了这些算法以外,有一些算法的名字在机器学习领域中也经常出现。但他们本身并不算是一个机器学习算法,而是为了解决某个子问题而诞生的。你可以理解他们为以上算法的子算法,用于大幅度提高训练过程。

其中的代表有:梯度下降法,主要运用在线型回归,逻辑回归,神经网络,推荐算法中;牛顿法,主要运用在线型回归中;BP算法,主要运用在神经网络中;SMO算法,主要运用在SVM中。

机器学习入门之四:机器学习的方法--svm(支持向量机)(转载)

...)    支持向量机算法是诞生于统计学习界,同时在机器学习界大放光彩的经典算法。   支持向量机算法从某种意义上来说是逻辑回归算法的强化:通过给予逻辑回归算法更严格的优化条件,支持向量机算法可以获得... 查看详情

机器学习笔记之四adaboost算法

本文结构:什么是集成学习?为什么集成的效果就会好于单个学习器?如何生成个体学习器?什么是Boosting?Adaboost算法?什么是集成学习集成学习就是将多个弱的学习器结合起来组成一个强的学习器。这就涉及到,先产生一组&lsq... 查看详情

机器学习入门

(原创文章,谢绝转载~)机器学习入门内容:1.过程:训练数据-》机器学习-》模型;  输入-》模型-》输出2.overfitting,过度拟合问题。为了符合所有的数据点,而导致过度拟合的模型。  confront过度拟合的常用方... 查看详情

[zz]机器学习的入门

...是基本按照下面的思路对着一个月做了一次总结:什么是机器学习?机器学习都有什么算法?个人对机器学习的三种境界理解推荐的学习路线推荐资源希望读者有所收获,另外,如果文中有任何理解上的错误,还望指正!什么是... 查看详情

机器学习算法入门

机器学习算法简单入门。由于团队(大数据团队)技术发展需要,借对交通业务数据进行需求拓展,实现数据挖掘和数据分析技术的掌握,绕不开机器学习算法,可以说,大数据的核心价值在于算法。 如下图,当前机器学习... 查看详情

转载零基础入门深度学习-参考文献

【转载】零基础入门深度学习-参考文献机器学习深度学习参考资料零基础入门深度学习(1)-感知器TomM.Mitchell,“机器学习”,曾华军等译,机械工业出版社零基础入门深度学习(2)-线性单元和梯度下降TomM.Mitchell,“机器学习”,曾华军... 查看详情

转载零基础入门深度学习-参考文献

【转载】零基础入门深度学习-参考文献机器学习深度学习参考资料零基础入门深度学习(1)-感知器TomM.Mitchell,“机器学习”,曾华军等译,机械工业出版社零基础入门深度学习(2)-线性单元和梯度下降TomM.Mitchell,“机器学习”,曾华军... 查看详情

机器学习算法实践:决策树(decisiontree)(转载)

  前言     最近打算系统学习下机器学习的基础算法,避免眼高手低,决定把常用的机器学习基础算法都实现一遍以便加深印象。本文为这系列博客的第一篇,关于决策树(DecisionTree)的算法实现,文中我将对决策树种... 查看详情

机器学习入门之算法研究

...获取更多学习资料,学习建议1.2深度学习之前:机器学习简史深度学习之前:机器学习简史深度学习已经得到了人工智能历史上前所未有的公众关注度和产业投资,但这并不是机器学习的第一次成功。可以这样说&... 查看详情

[阿里云-机器学习pai快速入门与业务实战]课时1-机器学习背景知识以及业务架构介绍

什么是机器学习?     机器学习指的是机器通过统计学算法,对大量的历史数据进行学习从而生成经验模型,利用经验模型指导业务。目前机器学习主要在一下一些方面发挥作用:营销类场景:商品推荐、用户... 查看详情

机器学习如何入门

...授权,非商业转载请注明出处。数学很多人翻看任何一本机器学习的书,看到一推的数学公式就开始打退堂鼓了。开始搜索,提问“机器学习需要哪些数学知识?”然后得到的结果可能会是“矩阵分析,概率论,优化设计……”... 查看详情

python3入门机器学习经典算法与应用

 第1章欢迎来到Python3玩转机器学习1-1什么是机器学习1-2课程涵盖的内容和理念1-3课程所使用的主要技术栈第2章机器学习基础2-1机器学习世界的数据2-2机器学习的主要任务2-3监督学习,非监督学习,半监督学习和增强学习2-4批... 查看详情

带你入门机器学习

什么是机器学习?机器学习的核心思想是创造一种普适的算法,它能从数据中挖掘出有趣的东西,而不需要针对某个问题去写代码。你需要做的只是把数据“投喂”给普适算法,然后它会在数据上建立自己的逻辑。比如说有一种... 查看详情

机器学习--入门答疑

刚接触机器学习这一个月我都做了什么?这一个月,从对机器学习充满好奇与畏惧,到对各种算法稍有理解以及围绕推荐场景的编码实践,算是对机器学习有了一个入门的体验。但是中间也踩过不少坑,比如啃过线性代数的教材... 查看详情

《机器学习算法入门》即将上市出版,预计2020年6,7月份

《机器学习入门》本书通过通俗易懂的语言,丰富的图示和经典的案例,让广大机器学习爱好者轻松入门机器学习MachineLearning,有效地降低了学习的门槛。本书共分11章节,覆盖的主要内容有机器学习概述、数据预处理、K近邻算... 查看详情

机器学习必备手册

机器学习是计算机科学的一个子领域,在人工智能领域,机器学习逐渐发展成模式识别和计算科学理论的研究。从2016年起,机器学习到达了不合理的火热巅峰。但是,有效的机器学习是困难的,因为机器学习本身就是一个交叉... 查看详情

机器学习方法:回归:线性回归linearregression

...载请注明:本文出自Bin的专栏blog.csdn.net/xbinworld。开一个机器学习方法科普系列:做基础回想之用。学而时习之;也拿出来与大家分享。数学水平有限,仅仅求易懂,学习与工作够用。周期会比較长。由于我还想写一些其它的,... 查看详情

机器学习入门点滴(待补充完整)

...)3.推荐书籍:选择一到两本公式较少、浅显易懂的介绍机器学习算法类型的书  1)中文-《机器学习》(周志华)、《统计学习方法》(李航)、《机器学习实战》(PeterHarrington)  2)外文-?(Patterncl 查看详情