机器学习初识

Soistesimmer Soistesimmer     2022-12-01     261

关键词:

目录

1.什么是机器学习

Arthur Samuel的定义:Machine Learning is fields of study that gives computers the ability to learn without being explicitly programmed(非显著式编程). 
非显著式编程:让计算机自己总结规律的编程方法。
举例:假设我们要通过编写程序来区分一张图片是菊花还是玫瑰。
如果我们去事先制定判别规则,如:红的是玫瑰,黄的是菊花,再去判断。这种就是显著式编程
如果我们仅仅提供一堆玫瑰和菊花的图片,通过程序让计算机自己去总结玫瑰和菊花的区别,从而制定判别标准,这种就是非显著式编程。
非显著式编程的优势在于我们不需要去规划一个操作的具体每一步要怎么做,只需要规定行为和收益函数,让计算机自己去找最大化收益函数的行为。

Tom Mitshell在他的书《Machine Learning》中这样定义:A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E.
(一个计算机程序能针对某个任务T和某个性能指标P,从经验E中学习。随着经验E的增加,性能指标P也会增加)
在上面的例子中,任务T为:编写计算机程序识别菊花和玫瑰,经验E为:一大堆菊花和玫瑰的图片,性能指标P为:识别率。识别率会随着样本的增加而增加,而显著式编程的识别率是定死的。

2.机器学习的分类

①监督学习(Supervised Learning)

例如:人脸识别、垃圾邮件识别
特点:我们需要人工采集训练样本,并且打标签(Labeling for training data) ,也就是告诉计算机训练样本是什么,从而获得经验E

(1)根据数据标签存在与否进行分类
   ①传统的监督学习(Traditional Supervised Learning):每一个训练数据都有对应的标签
   ②非监督学习(Unsupervised Learning):所有训练数据都没有对应的标签
    对应算法包括:聚类(Clustering)、EM算法(Expectation-Maximization algorithm)、主成分分析(Principle Component Analysis)

    不打标签我们也可以进行分类,看下面的例子

    ③半监督学习(Semi-Supervised Learning):一部分训练数据标注,一部分不标
    它之所以会出现,是因为网络上的数据越来越多,标注数据的成本也越来越高,所以我们试图用一部分标注数据和一部分未标的数据设计出更好的机器学习算法

(2)基于标签的固有属性进行分类

分类问题:判断两个人脸是不是同一个人的(我们可以打标签为0和1)
回归问题:预测股票价格、预测温度、预测人的年龄等等 
事实上,分类和回归问题的界限是非常模糊的,因为离散和连续的定义也是可以相互转换的

②强化学习(Reinforcement Learning)

例如:教计算机下棋、无人驾驶(教汽车从一个地方开到另一个地方) 
特点:计算机产生一些行为,程序去定义这些行为的收益函数(reward function),对行为进行奖惩计算机通过与环境的互动逐渐强化自己的行为模式

机器学习第一篇初识机器学习

一、什么是机器学习?对于机器学习,没有一个明确的定义。从广义上来说,机器学习是一种能够赋予机器学习的能力以此让它完成直接编程无法完成的功能的方法。但从实践的意义上来说,机器学习是一种通过利用数据,训练... 查看详情

初识机器学习

  翻开周志华老师的《机器学习》这本书,摘自绪论这段话:机器学习正是这样的一门学科,它致力于研究如何通过计算的手段,利用经验来改善系统自身的性能。而在计算机系统当中,“经验”就是以“数据”的形式存在,... 查看详情

初识机器学习

一、什么是机器学习?   机器学习,就是让计算机具有像人一样的学习能力,是从堆积如山的数据(也就是大数据)中寻找出有用知识的数据挖掘技术。1.1学习的种类  根据所处理的数据类型种类,将学习分为... 查看详情

机器学习初识

目录1.什么是机器学习ArthurSamuel的定义:MachineLearningisfieldsofstudythatgivescomputerstheabilitytolearnwithoutbeingexplicitlyprogrammed(非显著式编程). 非显著式编程:让计算机自己总结规律的编程方法。举例:假设我们要通过编写程序... 查看详情

andrewng机器学习第一章——初识机器学习

机器学习的定义  计算机程序从经验E中学习,解决某一任务T、进行某一性能度量P,通过P测定在T上的表现因E而提高。  简而言之:程序通过多次执行之后获得学习经验,利用这些经验可以使得程序的输出结果更为理想,就... 查看详情

机器学习——初识及实践选择

作为机器学习基础学习的开篇,记录一下自己对于机器学习基础的认识和实践选择。参考书目:机器学习实战这里也给出电子版本的中英文pdf文件和code:here(azkx) 我不会告诉你Ctrl+A会有其它发现~1、基础 对于机器学习的... 查看详情

初识机器学习

机器学习定义:在没有明确设置的情况下,使计算机具有学习能力的研究领域目前有各种不同的学习算法:最主要的两类是监督学习和无监督学习监督学习:我们会教计算机做某件事情,然后在无监督学习中,我们让计算机自己... 查看详情

初识机器学习-理论篇

1.什么是机器学习?概念:利用计算机从历史数据中找到规律,并把这些规律用到未来不确定场景的决策。场景:{①确定性场景②不确定性场景}(人来干)数据分析+(计算机来干)机器学习2.数据(历史数据)3.规律从数据中找... 查看详情

初识机器学习-人脸识别

 感谢知乎老狼https://zhuanlan.zhihu.com/p/27275307,点击链接Anaconda的安装face_recognition库安装1.代码fromPILimportImageimportface_recognition#Loadthejpgfileintoanumpyarrayimage=face_recognition.load_image_file("wa 查看详情

系列ml.net学习篇——初识机器学习

由于公司项目涉及到机器学习和图像识别,虽然我并不是算法专家,但毕竟需要了解和知道其运转原理,因此自我进行了学习进化,决定在机器学习上有所进展,结合.NET技术的ML.NET,把机器学习的技能提升一个Level&#... 查看详情

初识机器学习-理论篇(慕课笔记)

什么是机器学习 定义:利用计算机从历史数据中找出规律,并把这些规律用到对未来不确定场景的决策。从数据中寻找规律寻找规律:概率学统计学统计学方法:抽样->统计->假设检验随着计算机处理能力增强->不需要... 查看详情

系列ml.net学习篇——初识机器学习(代码片段)

由于公司项目涉及到机器学习和图像识别,虽然我并不是算法专家,但毕竟需要了解和知道其运转原理,因此自我进行了学习进化,决定在机器学习上有所进展,结合.NET技术的ML.NET,把机器学习的技能提升一个Level&#... 查看详情

机器学习--em算法从初识到应用

一、前述Em算法是解决数学公式的一个算法,是一种无监督的学习。EM算法是一种解决存在隐含变量优化问题的有效方法。EM算法是期望极大(ExpectationMaximization)算法的简称,EM算法是一种迭代型的算法,在每一次的迭代过程中,主... 查看详情

机器学习--关联规则算法从初识到应用

一、前述  关联规则的目的在于在一个数据集中找出项之间的关系,也称之为购物蓝分析(marketbasketanalysis)。例如,购买鞋的顾客,有10%的可能也会买袜子,60%的买面包的顾客,也会买牛奶。这其中最有名的例子就是"尿布和啤... 查看详情

机器学习sklearn----初识kmeans(代码片段)

文章目录概述KMeans中几个概念KMeans工作过程KMeans使用示例导入相关模块生成原始数据通过KMeans分类KMeans常用属性分类结果展示KMeans中的predict方法总结概述KMeans是一种无监督学习的方法。他是一种分类算法。用于探索原始数据ÿ... 查看详情

机器学习rnn——从初识到进阶

感谢中国人民大学的胡鹤老师,课程容量巨大,收获颇丰。之前提到的CNN模型主要用到人类的视觉中枢,但其有一劣势,无论是人类的视觉神经还是听觉神经,所接受到的都是一个连续的序列,使用CNN相当于割裂了前后的联系。... 查看详情

吴恩达《机器学习》章节1绪论:初识机器学习

1、欢迎参加《机器学习》 2、什么是机器学习?机器学习(MachineLearning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获... 查看详情

初识federatedlearning

...自己有的数据,是一个个数据孤岛。联邦学习的概念联邦机器学习是一个机器学习框架,能有效帮助多个机构在满足用户隐私保护、数据安全和政府法规的要求下,进行数据使用和机器学习建模。解决数据孤岛问题。建立基于分... 查看详情