初识机器学习

author author     2022-09-19     118

关键词:

  翻开周志华老师的《机器学习》这本书,摘自绪论这段话:机器学习正是这样的一门学科,它致力于研究如何通过计算的手段,利用经验来改善系统自身的性能。而在计算机系统当中,“经验”就是以“数据”的形式存在,所以,机器学习所研究的主要内容是:关于在计算机上从数据中产生“模型”的算法,即“学习算法”。

  要进行机器学习,首先要有数据,数据的集合称为数据集,而其中每条记录是关于一个事件或对象的描述,称为一个“示例”或“样本”,就像自己要做的MoviesLens数据集一样,用户、物品、评分、时间戳等为该数据集的属性;而对应的用户id,物品id,用户对物品的评分值作为属性值;可通过一个三维空间来描述这样的向量关系,用户id,物品id,评论值三者作为三条坐标轴,那么每一条这样的数据都可以在这个三维空间当中找到自己的位置。这里的“维数”就是指有多少个属性,例如MoviesLens数据集一般只用到三个属性,即可看成是三维空间。

  从数据中学得模型的过程称为“学习或训练”,这是通过算法实现的过程。那么这里所训练的数据称为“训练集”。那么要想得到一个“预测”模型,首先要得到结果信息,比如对于推荐系统,我看了一部电影,例如《赌神》,那么在1000部电影当中有10部电影是我喜欢的类型,通过预测模型计算出来的10部电影和我本身想得到结果进行对比,就可以知道我的这个预测模型准确率是多少了。

  若预测的是离散值,此类学习任务称为“分类”,若预测的是连续值,称为“回归”。根据训练数据是否拥有标记信息,学习任务可大致分为两大类:“监督学习”和“无监督学习”,其中分类和回归是前者的代表,聚类则是后者的代表。机器学习的目标是使学得的模型能很好的适用于“新样本”,而学得的模型适用于新样本的能力。称为“泛化”能力,且一般而言,训练的样本越多,就越有可能获得强泛化能力的模型。

  对于目前的大数据时代,作为三大关键技术:机器学习、云计算、众包;其中机器学习提供数据分析能力、云计算提供数据处理能力、众包提供数据标记能力。

  初识机器学习,以后会继续更新。

机器学习第一篇初识机器学习

一、什么是机器学习?对于机器学习,没有一个明确的定义。从广义上来说,机器学习是一种能够赋予机器学习的能力以此让它完成直接编程无法完成的功能的方法。但从实践的意义上来说,机器学习是一种通过利用数据,训练... 查看详情

初识机器学习

  翻开周志华老师的《机器学习》这本书,摘自绪论这段话:机器学习正是这样的一门学科,它致力于研究如何通过计算的手段,利用经验来改善系统自身的性能。而在计算机系统当中,“经验”就是以“数据”的形式存在,... 查看详情

初识机器学习

一、什么是机器学习?   机器学习,就是让计算机具有像人一样的学习能力,是从堆积如山的数据(也就是大数据)中寻找出有用知识的数据挖掘技术。1.1学习的种类  根据所处理的数据类型种类,将学习分为... 查看详情

机器学习初识

目录1.什么是机器学习ArthurSamuel的定义:MachineLearningisfieldsofstudythatgivescomputerstheabilitytolearnwithoutbeingexplicitlyprogrammed(非显著式编程). 非显著式编程:让计算机自己总结规律的编程方法。举例:假设我们要通过编写程序... 查看详情

andrewng机器学习第一章——初识机器学习

机器学习的定义  计算机程序从经验E中学习,解决某一任务T、进行某一性能度量P,通过P测定在T上的表现因E而提高。  简而言之:程序通过多次执行之后获得学习经验,利用这些经验可以使得程序的输出结果更为理想,就... 查看详情

机器学习——初识及实践选择

作为机器学习基础学习的开篇,记录一下自己对于机器学习基础的认识和实践选择。参考书目:机器学习实战这里也给出电子版本的中英文pdf文件和code:here(azkx) 我不会告诉你Ctrl+A会有其它发现~1、基础 对于机器学习的... 查看详情

初识机器学习

机器学习定义:在没有明确设置的情况下,使计算机具有学习能力的研究领域目前有各种不同的学习算法:最主要的两类是监督学习和无监督学习监督学习:我们会教计算机做某件事情,然后在无监督学习中,我们让计算机自己... 查看详情

初识机器学习-理论篇

1.什么是机器学习?概念:利用计算机从历史数据中找到规律,并把这些规律用到未来不确定场景的决策。场景:{①确定性场景②不确定性场景}(人来干)数据分析+(计算机来干)机器学习2.数据(历史数据)3.规律从数据中找... 查看详情

初识机器学习-人脸识别

 感谢知乎老狼https://zhuanlan.zhihu.com/p/27275307,点击链接Anaconda的安装face_recognition库安装1.代码fromPILimportImageimportface_recognition#Loadthejpgfileintoanumpyarrayimage=face_recognition.load_image_file("wa 查看详情

系列ml.net学习篇——初识机器学习

由于公司项目涉及到机器学习和图像识别,虽然我并不是算法专家,但毕竟需要了解和知道其运转原理,因此自我进行了学习进化,决定在机器学习上有所进展,结合.NET技术的ML.NET,把机器学习的技能提升一个Level&#... 查看详情

初识机器学习-理论篇(慕课笔记)

什么是机器学习 定义:利用计算机从历史数据中找出规律,并把这些规律用到对未来不确定场景的决策。从数据中寻找规律寻找规律:概率学统计学统计学方法:抽样->统计->假设检验随着计算机处理能力增强->不需要... 查看详情

系列ml.net学习篇——初识机器学习(代码片段)

由于公司项目涉及到机器学习和图像识别,虽然我并不是算法专家,但毕竟需要了解和知道其运转原理,因此自我进行了学习进化,决定在机器学习上有所进展,结合.NET技术的ML.NET,把机器学习的技能提升一个Level&#... 查看详情

机器学习--em算法从初识到应用

一、前述Em算法是解决数学公式的一个算法,是一种无监督的学习。EM算法是一种解决存在隐含变量优化问题的有效方法。EM算法是期望极大(ExpectationMaximization)算法的简称,EM算法是一种迭代型的算法,在每一次的迭代过程中,主... 查看详情

机器学习--关联规则算法从初识到应用

一、前述  关联规则的目的在于在一个数据集中找出项之间的关系,也称之为购物蓝分析(marketbasketanalysis)。例如,购买鞋的顾客,有10%的可能也会买袜子,60%的买面包的顾客,也会买牛奶。这其中最有名的例子就是"尿布和啤... 查看详情

机器学习sklearn----初识kmeans(代码片段)

文章目录概述KMeans中几个概念KMeans工作过程KMeans使用示例导入相关模块生成原始数据通过KMeans分类KMeans常用属性分类结果展示KMeans中的predict方法总结概述KMeans是一种无监督学习的方法。他是一种分类算法。用于探索原始数据ÿ... 查看详情

机器学习rnn——从初识到进阶

感谢中国人民大学的胡鹤老师,课程容量巨大,收获颇丰。之前提到的CNN模型主要用到人类的视觉中枢,但其有一劣势,无论是人类的视觉神经还是听觉神经,所接受到的都是一个连续的序列,使用CNN相当于割裂了前后的联系。... 查看详情

吴恩达《机器学习》章节1绪论:初识机器学习

1、欢迎参加《机器学习》 2、什么是机器学习?机器学习(MachineLearning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获... 查看详情

初识federatedlearning

背景设备中有很多数据,可以用来训练模型提高用户体验。但是数据通常是敏感或者庞大的。隐私问题数据孤岛:每个公司都有数据,淘宝有你的购买记录,银行有你的资金状况,它们不能把数据共享,都是自己训练自己有的数... 查看详情