机器学习初探——机器学习的基本概念

author author     2022-09-17     747

关键词:

机器学习

机器学习研究的主要内容:使计算机从数据中产生“模型”的算法。

机器学习的基本术语

我们认为将一组数据可以抽象画表示为一个向量Xi,D={X1,X2,X3..Xm}表示包含m个示例的数据集,每一个Xi是由一系列属性描述所构成的,Xij则表示第i个示例的第j个特征或属性。

  • 所有记录的集合为:数据集(D)
  • 每一条记录为:一个实例(instance)或样本(sample),(样本、示例、记录:Xi)。
  • 一个样本的特征数为:维数(dimensionality),属性空间的维数,当维数非常大时,也就是现在说的“维数灾难”,(特征、属性j的维数)。
  • 属性空间、样本空间、输入空间。这似乎是线性代数的语言,即把属性当作坐标轴,形成一个空间,将Xi在该空间表示为一个点。
  • 标记——关于样本结果的信息。
  • 样例——带有标记的样本。
  • 标记空间、输出空间——所有标记的集合(例如好瓜,坏瓜)。
  • 假设——也称假设函数,指计算机通过学习后得到的一个函数(预测模型)。

机器学习的步骤

通过一系列数据集-->找出属性(特征)-->样本和标记空间对应(Xi,y)-->对样例结果进行分类-->分类(离散型)或回归(连续型)-->找到y=f(x)对应关系-->学习到“模型”-->测试。(y为标记空间)

学习模型后,使用模型进行预测的过程称为测试,被测试的样本称之为测试样本。

我们从样本数据中学得模型的过程称之为“学习”或“训练”,学习模型对应了相关数据某种潜在的规律(y=f(x)),学习的过程就是找出或逼近真相。、

对于学习任务可大致划分为2类:

  • 训练数据有标记信息的学习任务为:监督学习(supervised learning),分类和回归都是监督学习的范畴。
  • 训练数据没有标记信息的学习任务为:无监督学习(unsupervised learning),常见的有聚类和关联规则。

关于假设空间,版本空间,归纳偏好的理解

  • 假设空间”里的“假设”指的是假设函数,也就是机器学习的成果。例如我们做分类学习,那么通过数据训练后得到的分类模型就是我们得到的假设。假设空间是指所有可能假设组成的空间。也可以说是所有在表达形式上符合任务要求的假设函数的集合。
  • 版本空间:有很多策略来对假设空间的假设进行筛选,利用样本把假设空间里的假设一一排除,可能有多个假设与训练集一致,即存在着一致性的“假设集合”为版本空间。
  • 归纳偏好:在学习过程中对某类假设的偏好,即在众多的假设与观察一致的模型,采取哪一个模型更好?

小结:机器学习的基本术语,从实验数据到学习到模型的整个流程的疏通,以及个别概念的理解。

机器学习|机器学习概念理解与基本知识

机器学习概念理解与基本知识1、机器学习是什么在数据上通过算法总结出规律模式,应用在新数据上做预测。2、机器学习基本概念2.1、不同类型的问题监督学习:分类问题(选择)、回归问题(计算)无监督学习:聚类问题(... 查看详情

机器学习的基本概念

目录机器学习定义基本概念机器学习之常见应用框架机器学习、数据分析、数据挖掘区别与联系机器学习分类【重要】机器学习开发流程【重要】机器学习之商业场景  一、机器学习定义MachineLearning(ML)isascientificdisciplinetha... 查看详情

机器学习的基本概念

目录机器学习定义基本概念机器学习之常见应用框架机器学习、数据分析、数据挖掘区别与联系机器学习分类【重要】机器学习开发流程【重要】机器学习之商业场景??一、机器学习定义MachineLearning(ML)isascientificdisciplinethatdealswith... 查看详情

深度学习,机器学习所涵盖的100多个基本概念总结

目录一、基础算法二、经典算法三、机器学习四、优化算法五、特殊技巧 查看详情

斯坦福2014机器学习笔记一----基本概念

  一、纲要    机器学习的定义    监督学习(supervisedlearning)和无监督学习(unsupervisedlearning)    回归问题(regressionproblem)与分类问题(classificationproblem)    鸡尾酒宴问题    单变量线性回归问题   二... 查看详情

第一章机器学习基本概念

1.机器学习主要是通过计算机在已有的数据上(经验)产生相应的模型(学习算法),在面临新的情况时,模型能给出相应的判断。所以说机器学习是研究学习算法的学问。2基本术语2.1以西瓜是否成熟为例,(色泽=青绿;根蒂=... 查看详情

机器学习入门-基本概念

1、机器学习分为监督学习和非监督学习。首先学习监督学习。2、标签,即y值,结果,以通过机器学习过滤垃圾邮件为例,标签为邮件是垃圾邮件,或不是垃圾邮件3、特征,即x值,输入变量,通常有多个特征,如根据发件人、... 查看详情

机器学习基本概念

...kevdp.github.io/PythonDataScienceHandbook/00.00-preface.html1、什么是机器学习  机器学习是用数据科学的计算能力和算法能力去弥补统计方法的不足,其最终结果是为那些目前既没有高效的理论支持、又没有高效的计算方法的统计推理与... 查看详情

吐血整理:机器学习的30个基本概念,都在这里了(手绘图解)

导读:本文主要介绍机器学习基础知识,包括名词解释(约30个)、基础模型的算法原理及具体的建模过程。作者:梅子行、毛鑫宇来源:大数据DT(ID:hzdashuju)01 空间表征在学习深奥的机器学习理论之前,首先来介绍一些... 查看详情

机器学习与tensorflow——机器学习基本概念tensorflow实现简单线性回归(代码片段)

一、机器学习基本概念1.训练集和测试集训练集(trainingset/data)/训练样例(trainingexamples):用来进行训练,也就是产生模型或者算法的数据集测试集(testingset/data)/测试样例(testingexamples):用来专门进行测试已经学习好的模型或者算法... 查看详情

机器学习基本概念

1为什么随机梯度下降法能work?https://www.zhihu.com/question/27012077中回答者李文哲的解释 2随机梯度下降法的好处?(1)加快训练速度(2)噪音可以使得跳出局部最优 3权衡方差和偏差:偏差反映的是模型的准确度(对训练数... 查看详情

机器学习:基本概念五大流派与九种常见算法

机器学习正在进步,我们正在不断接近创造人工智能的目标。语音识别、图像检测、机器翻译、风格迁移等技术已经在生活中开始得到了应用,但机器学习的发展仍还在继续,有人认为这场变革有可能会彻底改变人类文明的发展... 查看详情

机器学习-1基本概念

一、训练集和测试集  训练集(trainingset/data)/训练样例(trainingexamples):用来进行训练,也就是产生模型或者算法的数据集。  测试集(testingset/data)/测试样例(testingexamples):用来专门进行测试已经学习好的模型或者算法的数据集... 查看详情

反作弊基本概念与机器学习的应用

反作弊主要业务流程: 常见作弊方式:机器作弊:机器刷量、任务分发、流量劫持人为作弊:QQ群/水军、直接人工、诱导 常见作弊手段:电商:刷单,刷信誉,刷好评,职业差评师支付平台:洗钱,诈骗广告:数据造假... 查看详情

机器学习的基本概念理解

术语理解示例:        对应着数据中的一条记录(多条记录构成数据集)。可以包含标记,也可以不包含标记。    假设一条记录有多个属性构成的,则这条记录就有5维。多个属性构成的... 查看详情

机器学习

1、基本概念:训练集,测试集,特征集,非监督学习,半监督学习,分类,回归2、概念学习:概念学习是指从有关某个布尔函数的输入输出训练样例中推断出该布尔函数。3、小例子    概念定义在实例(instance)... 查看详情

tensorflow初探

...用点.其中TensorFlow作为目前的一个热点值得我们重点关注.机器学习机器学习是人工智能的一个分支,也是用来实现人工只能的一种方法。简单来说,机器学习就是通过算法,使得机器能从大量历史数据中学习规律,从而对新的样... 查看详情

ios:使用coreml进行机器学习初探(代码片段)

1.什么是机器学习?从广义上来说,机器学习是一种能够赋予机器学习的能力以此让它完成直接编程无法完成的功能的方法。但从实践的意义上来说,机器学习是一种通过利用数据,训练出模型,然后使用模型... 查看详情