初识机器学习

author author     2022-10-08     398

关键词:

一、什么是机器学习?

    机器学习,就是让计算机具有像人一样的学习能力,是从堆积如山的数据(也就是大数据)中寻找出有用知识的数据挖掘技术

1.1 学习的种类

    根据所处理的数据类型种类,将学习分为:监督学习,无监督学习和强化学习等。为了更好的理解,我们用学生和老师的关系来进行概念说明:学生对应于计算机,老师对应于周围的环境。

监督学习

    指有求知欲的学生从老师那里获取知识和信息,老师提供对错指示并告知最终答案的学习过程。监督学习的最终目标是:根据在学习过程中所获得的经验和技能,对没有学习过的问题也可以做出正确的解答,并使计算机具有这种泛化的能力。

    此类学习可以应用于手写文字识别、声音图像处理、垃圾邮件的分类与拦截、网页检索和基因诊断等。其典型的任务有:预测数值型数据的回归、预测分类标签的分类、预测顺序的排序等。

无监督学习

    指在没有老师的情况下,学生自学的过程,在机器学习中计算机在互联网中自动收集信息,获取有用的知识。无监督学习在人造卫星故障诊断、视频分析、社交网站解析和声音解析等方面有广泛运用。典型的任务有:聚类、异常检测等。

强化学习

    指在没有老师提示的情况下,自己对预测的结果进行评估的方法,通过这样的自我评估,机器会为了更好更准确判断而不断的进行学习。强化学习在人的自动控制、计算机游戏中的人工智能、市场战略的最优化等方面具有广泛的应用。典型的任务有:回归、聚类和降维等。

1.2 机器学习任务

    上一部分中我提到了一些典型的任务,那么这些任务其实可以理解为机器学习的典型算法。

回归:回归方法是一种对数值型连续随机变量进行预测和建模的监督学习算法,其任务的特点是标注的数据集具有数值型的目标变量。也就是说,每一个观察样本都有一个数值型的标注真值以监督算法。包括:线性回归(正则化)、回归树(集成方法)、深度学习、最近邻算法等。

分类分类方法是一种对离散型随机变量建模或预测的监督学习算法,许多回归算法都有与其相对应的分类算法,分类算法通常适用于预测一个类别(或类别的概率)而不是连续的数值。包括:Logistic回归(正则化)、分类树(集成方法)、深度学习、支持向量机、朴素贝叶斯等。

聚类:聚类是一种无监督学习任务,该算法基于数据的内部结构寻找观察样本的自然族群(即集群),因为聚类是一种无监督学习(即数据没有标注),并且通常使用数据可视化评价结果。包括:K均值聚类、AP聚类、层次聚类、DBScan等。

    以上三种典型的机器学习算法的解析及优缺点分析可以看知乎专栏:

              https://zhuanlan.zhihu.com/p/27013861

异常检测:指寻找输入样本中所包含的异常数据的问题。在无监督的异常检测问题中,一般采用密度估计的方法,把靠近密度中心的数据作为正常数据,把偏离密度中心的数据作为异常数据。

降维:是指从高维度数据中提取关键信息,将其转换为易于计算的低维度问题进而求解的方法。


   先大概了解一下,算法详解和实现慢慢做吧。又是新的一年,每天学点新的知识,你好啊,2018!

机器学习第一篇初识机器学习

一、什么是机器学习?对于机器学习,没有一个明确的定义。从广义上来说,机器学习是一种能够赋予机器学习的能力以此让它完成直接编程无法完成的功能的方法。但从实践的意义上来说,机器学习是一种通过利用数据,训练... 查看详情

初识机器学习

  翻开周志华老师的《机器学习》这本书,摘自绪论这段话:机器学习正是这样的一门学科,它致力于研究如何通过计算的手段,利用经验来改善系统自身的性能。而在计算机系统当中,“经验”就是以“数据”的形式存在,... 查看详情

初识机器学习

一、什么是机器学习?   机器学习,就是让计算机具有像人一样的学习能力,是从堆积如山的数据(也就是大数据)中寻找出有用知识的数据挖掘技术。1.1学习的种类  根据所处理的数据类型种类,将学习分为... 查看详情

机器学习初识

目录1.什么是机器学习ArthurSamuel的定义:MachineLearningisfieldsofstudythatgivescomputerstheabilitytolearnwithoutbeingexplicitlyprogrammed(非显著式编程). 非显著式编程:让计算机自己总结规律的编程方法。举例:假设我们要通过编写程序... 查看详情

andrewng机器学习第一章——初识机器学习

机器学习的定义  计算机程序从经验E中学习,解决某一任务T、进行某一性能度量P,通过P测定在T上的表现因E而提高。  简而言之:程序通过多次执行之后获得学习经验,利用这些经验可以使得程序的输出结果更为理想,就... 查看详情

机器学习——初识及实践选择

作为机器学习基础学习的开篇,记录一下自己对于机器学习基础的认识和实践选择。参考书目:机器学习实战这里也给出电子版本的中英文pdf文件和code:here(azkx) 我不会告诉你Ctrl+A会有其它发现~1、基础 对于机器学习的... 查看详情

初识机器学习

机器学习定义:在没有明确设置的情况下,使计算机具有学习能力的研究领域目前有各种不同的学习算法:最主要的两类是监督学习和无监督学习监督学习:我们会教计算机做某件事情,然后在无监督学习中,我们让计算机自己... 查看详情

初识机器学习-理论篇

1.什么是机器学习?概念:利用计算机从历史数据中找到规律,并把这些规律用到未来不确定场景的决策。场景:{①确定性场景②不确定性场景}(人来干)数据分析+(计算机来干)机器学习2.数据(历史数据)3.规律从数据中找... 查看详情

初识机器学习-人脸识别

 感谢知乎老狼https://zhuanlan.zhihu.com/p/27275307,点击链接Anaconda的安装face_recognition库安装1.代码fromPILimportImageimportface_recognition#Loadthejpgfileintoanumpyarrayimage=face_recognition.load_image_file("wa 查看详情

系列ml.net学习篇——初识机器学习

由于公司项目涉及到机器学习和图像识别,虽然我并不是算法专家,但毕竟需要了解和知道其运转原理,因此自我进行了学习进化,决定在机器学习上有所进展,结合.NET技术的ML.NET,把机器学习的技能提升一个Level&#... 查看详情

初识机器学习-理论篇(慕课笔记)

什么是机器学习 定义:利用计算机从历史数据中找出规律,并把这些规律用到对未来不确定场景的决策。从数据中寻找规律寻找规律:概率学统计学统计学方法:抽样->统计->假设检验随着计算机处理能力增强->不需要... 查看详情

系列ml.net学习篇——初识机器学习(代码片段)

由于公司项目涉及到机器学习和图像识别,虽然我并不是算法专家,但毕竟需要了解和知道其运转原理,因此自我进行了学习进化,决定在机器学习上有所进展,结合.NET技术的ML.NET,把机器学习的技能提升一个Level&#... 查看详情

机器学习--em算法从初识到应用

一、前述Em算法是解决数学公式的一个算法,是一种无监督的学习。EM算法是一种解决存在隐含变量优化问题的有效方法。EM算法是期望极大(ExpectationMaximization)算法的简称,EM算法是一种迭代型的算法,在每一次的迭代过程中,主... 查看详情

机器学习--关联规则算法从初识到应用

一、前述  关联规则的目的在于在一个数据集中找出项之间的关系,也称之为购物蓝分析(marketbasketanalysis)。例如,购买鞋的顾客,有10%的可能也会买袜子,60%的买面包的顾客,也会买牛奶。这其中最有名的例子就是"尿布和啤... 查看详情

机器学习sklearn----初识kmeans(代码片段)

文章目录概述KMeans中几个概念KMeans工作过程KMeans使用示例导入相关模块生成原始数据通过KMeans分类KMeans常用属性分类结果展示KMeans中的predict方法总结概述KMeans是一种无监督学习的方法。他是一种分类算法。用于探索原始数据ÿ... 查看详情

机器学习rnn——从初识到进阶

感谢中国人民大学的胡鹤老师,课程容量巨大,收获颇丰。之前提到的CNN模型主要用到人类的视觉中枢,但其有一劣势,无论是人类的视觉神经还是听觉神经,所接受到的都是一个连续的序列,使用CNN相当于割裂了前后的联系。... 查看详情

吴恩达《机器学习》章节1绪论:初识机器学习

1、欢迎参加《机器学习》 2、什么是机器学习?机器学习(MachineLearning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获... 查看详情

初识federatedlearning

背景设备中有很多数据,可以用来训练模型提高用户体验。但是数据通常是敏感或者庞大的。隐私问题数据孤岛:每个公司都有数据,淘宝有你的购买记录,银行有你的资金状况,它们不能把数据共享,都是自己训练自己有的数... 查看详情