机器学习基本概念

nuochengze nuochengze     2023-04-11     662

关键词:

内容来源:

https://jakevdp.github.io/PythonDataScienceHandbook/00.00-preface.html

1、什么是机器学习

  机器学习是用数据科学的计算能力和算法能力去弥补统计方法的不足,其最终结果是为那些目前既没有高效的理论支持、又没有高效的计算方法的统计推理与数据探索问题提供解决方法。

  机器学习本质上就是借助数学模型理解数据,即在模型上调整可以观测数据的参数来预测并解释新的观测数据。

2、机器学习的分类

  机器学习一般可以分为两类:有监督学习(supervised learning)和无监督学习(unsupervised learning)。

  2.1 有监督学习

    有监督学习是指对数据的若干特征与若干标签(类型)之间的关联性进行建模的过程,只要模型被确定,就可以应用到新的未知数据上。

    有监督学习可以进一步分类为分类(classification)任务与回归(regression)任务。

    在分类任务中,标签都是离散值;而在回归任务中,标签都是连续值。

  2.2 无监督学习

    无监督学习是指对不带任何标签的数据特征进行建模,通常被看成是一种‘让数据自己介绍自己‘的过程。

    无监督学习包括聚类(clustering)任务和降维(dimensionality reduction)任务。

    聚类算法可以将数据分成不同的组别,而降维算法追求用更简洁的方式表现数据。

  2.3 半监督学习

    半监督学习(semi-supervised learning)方法,介于有监督学习与无监督学习之间。

    半监督学习方法通常可以在数据标签不完整时使用。

3、机器学习应用的定性示例

  1、分类:预测离散标签

    数据点都有两个特征,在平面上数据点的位置(x,y),颜色表示的类型标签

    其中的模型就是一条可以分类的直线,模型参数是直线的位置与方向的数值

    可以用现有数据训练模型,来对一个新的不带标签的数据分类。

  2、回归:预测连续标签

    技术图片

 

    每个数据点有两个特征,数据点的颜色表示每个点的连续标签

   用简单线性回归模型作出假设,如果我们把标签看成是第三个维度,那么就可以将数据拟合成一个平面方程。

  3、聚类:为无标签数据添加标签

    数据被聚类算法自动分成若干离散的组别

    技术图片

 

   4、降维:推断无标签数据的结构

    降维需要从数据集本身的结构推断标签和其他信息,其实就是在保证高维数据质量的条件下从中抽取出一个低维数据集

    技术图片

 

 4、总结

  1、有监督学习

    可以训练带标签的数据以预测新数据标签的模型

    1.1 分类

      可以预测两个或多个离散分类标签的模型

    1.2 回归

      可以预测连续标签的模型

  2、无监督学习

    识别无标签数据结构的模型

    2.1 聚类

      检测、识别数据显著组别的模型

    2.2 降维 

      从高维数据中检测、识别低维数据结构的模型  

斯坦福2014机器学习笔记一----基本概念

  一、纲要    机器学习的定义    监督学习(supervisedlearning)和无监督学习(unsupervisedlearning)    回归问题(regressionproblem)与分类问题(classificationproblem)    鸡尾酒宴问题    单变量线性回归问题   二... 查看详情

机器学习初探——机器学习的基本概念

机器学习机器学习研究的主要内容:使计算机从数据中产生“模型”的算法。机器学习的基本术语我们认为将一组数据可以抽象画表示为一个向量Xi,D={X1,X2,X3..Xm}表示包含m个示例的数据集,每一个Xi是由一系列属性描述所构成的... 查看详情

深度学习,机器学习所涵盖的100多个基本概念总结

目录一、基础算法二、经典算法三、机器学习四、优化算法五、特殊技巧 查看详情

机器学习入门-基本概念

1、机器学习分为监督学习和非监督学习。首先学习监督学习。2、标签,即y值,结果,以通过机器学习过滤垃圾邮件为例,标签为邮件是垃圾邮件,或不是垃圾邮件3、特征,即x值,输入变量,通常有多个特征,如根据发件人、... 查看详情

机器学习的基本概念

目录机器学习定义基本概念机器学习之常见应用框架机器学习、数据分析、数据挖掘区别与联系机器学习分类【重要】机器学习开发流程【重要】机器学习之商业场景  一、机器学习定义MachineLearning(ML)isascientificdisciplinetha... 查看详情

机器学习的基本概念

目录机器学习定义基本概念机器学习之常见应用框架机器学习、数据分析、数据挖掘区别与联系机器学习分类【重要】机器学习开发流程【重要】机器学习之商业场景??一、机器学习定义MachineLearning(ML)isascientificdisciplinethatdealswith... 查看详情

机器学习算法(代码片段)

机器学习常用算法一、线性回归1.基本概念2.代码实现二、逻辑回归1.基本概念Sigmoid预测函数2.代码实现三决策树1.基本概念2.代码实现四支持向量机(SVM)1.基本概念2.代码实现五全连接神经网络DNN1.基本概念全连接神经网... 查看详情

第一章机器学习基本概念

1.机器学习主要是通过计算机在已有的数据上(经验)产生相应的模型(学习算法),在面临新的情况时,模型能给出相应的判断。所以说机器学习是研究学习算法的学问。2基本术语2.1以西瓜是否成熟为例,(色泽=青绿;根蒂=... 查看详情

机器学习基本概念

1为什么随机梯度下降法能work?https://www.zhihu.com/question/27012077中回答者李文哲的解释 2随机梯度下降法的好处?(1)加快训练速度(2)噪音可以使得跳出局部最优 3权衡方差和偏差:偏差反映的是模型的准确度(对训练数... 查看详情

增强学习-----基本概念

机器学习算法大致可以分为三种:  1.监督学习(如回归,分类)  2. 非监督学习(如聚类,降维)  3.增强学习什么是增强学习呢?增强学习(reinforcementlearning,RL)又叫做强化学习,是近年来机器学习和智能... 查看详情

吐血整理:机器学习的30个基本概念,都在这里了(手绘图解)

导读:本文主要介绍机器学习基础知识,包括名词解释(约30个)、基础模型的算法原理及具体的建模过程。作者:梅子行、毛鑫宇来源:大数据DT(ID:hzdashuju)01 空间表征在学习深奥的机器学习理论之前,首先来介绍一些... 查看详情

机器学习-1基本概念

一、训练集和测试集  训练集(trainingset/data)/训练样例(trainingexamples):用来进行训练,也就是产生模型或者算法的数据集。  测试集(testingset/data)/测试样例(testingexamples):用来专门进行测试已经学习好的模型或者算法的数据集... 查看详情

机器学习基本概念和模型训练基本问题

分类与回归的区别二叉树二叉树很容易理解,在这里我们一般用满二叉树:就是非叶子节点都有2个分支的树形数据结构决策树分类决策树最初是用来做决策用的,就好像下面的见不见相亲对象的决策过程一样;如果把最后的决... 查看详情

机器学习的基本概念理解

术语理解示例:        对应着数据中的一条记录(多条记录构成数据集)。可以包含标记,也可以不包含标记。    假设一条记录有多个属性构成的,则这条记录就有5维。多个属性构成的... 查看详情

反作弊基本概念与机器学习的应用

反作弊主要业务流程: 常见作弊方式:机器作弊:机器刷量、任务分发、流量劫持人为作弊:QQ群/水军、直接人工、诱导 常见作弊手段:电商:刷单,刷信誉,刷好评,职业差评师支付平台:洗钱,诈骗广告:数据造假... 查看详情

机器学习与tensorflow——机器学习基本概念tensorflow实现简单线性回归(代码片段)

一、机器学习基本概念1.训练集和测试集训练集(trainingset/data)/训练样例(trainingexamples):用来进行训练,也就是产生模型或者算法的数据集测试集(testingset/data)/测试样例(testingexamples):用来专门进行测试已经学习好的模型或者算法... 查看详情

机器学习基本概念

...kevdp.github.io/PythonDataScienceHandbook/00.00-preface.html1、什么是机器学习  机器学习是用数据科学的计算能力和算法能力去弥补统计方法的不足,其最终结果是为那些目前既没有高效的理论支持、又没有高效的计算方法的统计推理与... 查看详情

机器学习基本概念理解

数据集:关系型数据库中有很多表,表里面有很多记录,很多记录就可以认为是数据集属性(特征):一个表中有很多条记录,每条记录的表有很多属性,如tb_stu(stu_id,stuname,stu_sex)s表中有3条属性属性值:属性的取值,如stu_id可... 查看详情