机器学习简介

蜗牛K 蜗牛K     2022-09-24     415

关键词:

 

 

简单介绍一下机器学习:

  简单理解一下“机器学习”:从字面上,可以想到,让机器去学习,学习什么呢?简单来说其实就是从数据中学习得到一些信息。机器学习能让我们从数据集中受到启发,意思就是,利用计算机来彰显数据背后的真实含义,这就是机器学习的真实含义。机器学习对于任何需要解释并操作数据的领域都

是很有用的。

 

  机器学习主要分为两类:监督学习和非监督学习。顾名思义,由名称可以简单理解,监督学习也就是有相应已知数据支持情况下的机器学习,而非监督学习是没有任何知识所支持的机器学习。这样说可能不是那么明白,接着往下理解。

  监督学习又分为两个问题,一个问题是分类,另一个是回归。分类就是利用已知类别的数据来学习一个分类标准,然后利用该分类标准去分类那些未被标识类别的数据;回归主要指的是预测数值型数据,大多数人可能都见过回归的例子——数据拟合曲线:通过给定数据点的最优拟合曲线。由此可以看出,分类和回归都需要有已知数据的支持的,分类算法都要求输入大量已被标识好类别的数据作为算法的训练集,对于机器学习算法都有一个目标变量分类算法中的目标变量就是类别的集合,通常是标称型的数据。而回归算法通常是连续型的

  与监督学习相对应的无监督学习,此时数据没有类别信息,也不会给定目标值。无监督学习也主要包含两类,其一:将数据集合划分成几个由相似对象组成的群组(或类别),这个过程称为聚类;其二是:将寻找描述数据统计值的过程称之为密度估计。此外,无监督学习还可以减少数据特征的位度,以便我们可以使用二维图或三维图更加直地展示数据信息。

  下面贴出一张表格来显示处理这四个问题的机器学习算法:

    

 

  其中解决某个问题的算法都有好几种,那么就引出了一个问题,该选择何种算法来解决问题呢?

  在选择实际可用的算法时,要考虑两个方面:

• 目的是什么?也就是说要解决什么问题,解决什么问题就找到相对应的方法。

• 要分析或收集的数据是什么(数值型或标称型等等)。

  在考虑这两个问题的时候,就可以初步确定要用的算法了。

  首先考虑目的如果要预测目标变量的值,就选择监督学习,否则则选择非监督学习。选择了监督学习之后,思考要分析的数据类型是什么类型的数据,如果目标变量是离散型数据则选择分类算法,如果目标变量是连续型数据则选择回归算法。如果不预测目标变量的值,则选择非监督学习,然后进一步分析是否需要将数据划分为离散的组。如果这是唯一的要求,则选择聚类算法;如果还需要估计数据与每个分组的相似程度,则需要使用密度估计算法。不过这不是一成不变的,比如有时也会使用分类算法来处理回归问题。

  考虑完目的,其次就要考虑数据的问题,要充分了解数据,对实际数据越了解,越容易找到符合实际需求的应用程序。主要该了解数据的特性如下:特征值是离散型变量还是连续型变量特征值是否存在缺失的值,什么原因造成了数据的缺失数据中是否包含异常的值,某个特征发生的频率是怎样的(是否很罕见如大海捞针一样)。了解了这些就可以很好的缩短选择算法的时间。

  通过以上方法只是能最大程度的缩小选择算法的范围,但一般并不存在最好的算法或者可以给出最好结果的算法,同时还要尝试其他的算法去查看效果的好坏。一般来说发现最好算法的关键环节就是反复试错的迭代过程

 

  接下来说一下开发机器学习应用程序的基本步骤:

  1. 收集数据。机器学习算法都离不开数据,只有有了数据才可以做分类,回归,聚类以及密度估计。
  2. 准备输入数据。再有了数据之后,还要让数据符合机器学习算法的格式要求,根据格式的要求对数据进行处理。
  3. 分析输入数据。这个步骤主要是人工分析得到的数据。主要分析数据是否有空值;数据是否分析出相应的模式或知识;数据中是否存在异常值。这里可以通过一维、二维或三维图形展示来查看数据的差异等。这一步主要作用是确保数据中没有垃圾数据,以便后续步骤更好的进行。
  4. 训练算法。将前面得到的数据输入到机器学习的算法, 从数据中得到相应的信息或知识模式。这里需要将得到的知识存储为计算机可以处理的格式,方便后续步骤使用。如果使用无监督学习,由于不存在目标变量值,因此这一步可以省掉。
  5. 预测算法。这一步是使用步骤4中得到知识模式,来检验算法的性能,评估算法。如果不满意算法的输出结果,可以回到步骤4继续调试来获取好的结果。
  6. 使用算法。将机器学习算法转换为应用程序,去解决实际的问题。这里也要不断地从实际情况中去检验算法的好坏,碰到新的问题,同样需要重复以上步骤进行改进。

 

 

 

 

机器学习,主要为了理解数据背后的含义。学习数据中所隐藏着的知识模式,用得到的知识模式反馈到现实的问题中。

     

学习笔记spark——sparkmllib应用——机器学习简介sparkmllib简介

一、机器学习简介1.1、机器学习概念机器学习就是让机器能像人一样有学习、理解、认识的能力。机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能。机... 查看详情

学习笔记spark——sparkmllib应用——机器学习简介sparkmllib简介

一、机器学习简介1.1、机器学习概念机器学习就是让机器能像人一样有学习、理解、认识的能力。机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能。机... 查看详情

林轩田《机器学习基石》简介

...7672课程介绍台湾大学林轩田老师曾在coursera上开设了两门机器学习经典课程:《机器学习基石》和《机器学习技法》。《机器学习基石》课程由浅入深、内容全面,基本涵盖了机器学习领域的很多方面。其作为机器学习的入门和... 查看详情

01_机器学习简介

机器学习目标: 以算法、案例为驱动的学习,浅显易懂的数学知识。目标: 熟悉机器学习各类算法的原理    掌握算法的使用,能够结合场景解决实际问题    掌握机器学习算法库和框架的技能 机器学习主要领... 查看详情

机器学习简介

1.算法及解决问题介绍2.开发机器学习程序的基本步骤:  1)收集数据。  2)准备输入数据。保证格式相符。  3)分析输入数据。保证数据有效性。  4)训练算法。3.开发环境  1)python  2)Numpy函数库  查看详情

机器学习简介

转载请标明出处:小帆的帆的专栏什么样的问题适合机器学习解决存在某种隐含规则规则很复杂有学习这个规则的数据问题Whichofthefollowingproblemsarebestsuitedformachinelearning?(i)Classifyingnumbersintoprimesandnon-primes(ii)Detectingpotentialfraudinc... 查看详情

1.机器学习简介

1.机器学习简介机器学习是一个充满科幻感的词,会让人想到一台能够学习说话、跳舞和下棋的聪明的机器。然而正如家里会四处移动扫地的圆盘和工厂里组装汽车的机械臂被称为机器人,机器学习大部分研究的问题和应... 查看详情

1.机器学习简介

1.机器学习简介机器学习是一个充满科幻感的词,会让人想到一台能够学习说话、跳舞和下棋的聪明的机器。然而正如家里会四处移动扫地的圆盘和工厂里组装汽车的机械臂被称为机器人,机器学习大部分研究的问题和应... 查看详情

机器学习简介

 这一篇文章主要是介绍机器学习的概念机器学习(MachineLearning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论等理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织... 查看详情

[ml]机器学习简介

...UnsupervisedLearning)  通过有标签或没标签的数据集,让机器自己去找出规律。比如分类算法。 结构化学习(StructuredLearning) 强化学习(Reinfor 查看详情

机器学习简介

通俗来说,机器学习是将无预数据转化为价值的方法。机器学习的价值在于从数据中抽取规律并用来预测未来。机器学习可以应用于分类问题、回归问题、排序问题和生成问题。分类问题如图像识别,垃圾邮件识别;回归问题和... 查看详情

机器学习入门机器学习简介|附加小练习(代码片段)

目录1.机器学习是什么2.机器学习、深度学习和人工智能的区别与联系3.机器学习的应用4.机器学习分类4.1监督学习4.2无监督学习4.3半监督学习4.4强化学习5.小练习5.1第一题5.2第二题5.3第三题1.机器学习是什么用老师上课的一张图我... 查看详情

hit机器学习期末复习——机器学习简介及决策树

刘杨的机器学习终于上完了惹,下周就要考试了,赶紧复习ing......趁机做个总结,就当是复习了惹......机器学习简介1、什么是机器学习简单来说,就是一个三元组<P,T,E>P——performance性能(对应着性能的评估函数,也就是常... 查看详情

机器学习算法简介

...获取更多腾讯海量技术实践干货哦~导语: 本文是对机器学习算法的一个概览,以及个人的学习小结。通过阅读本文,可以快速地对机器学习算法有一个比较清晰的了解。本文承诺不会出现任何数学公式及推导,适合茶余饭... 查看详情

机器学习算法简介

...腾讯海量技术实践干货哦~作者:吴懿伦导语:本文是对机器学习算法的一个概览,以及个人的学习小结。通过阅读本文,可以快速地对机器学习算法有一个比较清晰的了解。本文承诺不会出现任何数学公式及推导,适合茶余饭... 查看详情

machinelearn机器学习及其基础概念简介

机器学习及其基础概念简介作者:白宁超2016年12月23日21:24:51摘要:随着机器学习和深度学习的热潮,各种图书层出不穷。然而多数是基础理论知识介绍,缺乏实现的深入理解。本系列文章是作者结合视频学习和书籍基础的笔记... 查看详情

机器学习简介

开始学习机器学习的基础知识了,下面是我在看书过程中,整理的一些重点。看的书是《机器学习实战》。 系统用来学习的这些示例,我们称之为训练集。每一个训练示例称为训练实例或者是训练样本。机器学习与数据挖掘... 查看详情

机器学习朴素贝叶斯分类器返回语句简介

】机器学习朴素贝叶斯分类器返回语句简介【英文标题】:Introtomachinelearningnaivebayesclassifierreturnstatement【发布时间】:2021-01-1302:15:40【问题描述】:我尝试从Udacity的机器学习入门课程中学习机器学习。第2课-朴素贝叶斯测验19:... 查看详情