机器学习的基础概念(代码片段)

windyrainy windyrainy     2022-12-11     345

关键词:

一、概念理解

机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。

  它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演绎。

  机器学习有下面几种定义:(一个讲的比较好的文章)

  • “机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能”。
  • “机器学习是对能通过经验自动改进的计算机算法的研究”。
  • “机器学习是用数据或以往的经验,以此优化计算机程序的性能标准。”

  一种经常引用的英文定义是:A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.

二、应用  

  机器学习已经有了十分广泛的应用,例如:数据挖掘、计算机视觉、自然语言处理、生物特征识别、搜索引擎、医学诊断、检测信用卡欺诈、证券市场分析、DNA序列测序、语音和手写识别、战略游戏和机器人运用。

3、划分情况

机器学习不仅有一种方法,实现它的方法多种多样。这里所说的方法,在程序语言中,我们叫做算法。目前所有机器学习算法大致上可以被分为5类模式:

1、监督学习模式:supervised learning
  如果在学习过程中,我们不断的向计算机提供数据和这些数据对应的值,比如说给计算机看猫和狗的图片,告诉计算机那些图片里是猫,那些是狗,然后在让它学习去分辨猫和狗。通过这种指引的方式,让计算机学习我们是如何把这些图片数据对应上图片所代表的物体。也就是让计算机学习这些标签可以代表那些图片。这种学习方式叫做“监督学习”。预测房屋的价格,股票的涨停同样可以用监督学习来实现。大家所熟知的神经网络同样是一种监督学习的方式。

2、非监督学习模式:unsupervised learning
  同样在这种学习过程中,我只给计算机提供猫和狗的图片,但是并没有告诉它那些是猫那些是狗。取而代之的是,我让它主机去判断和分类。让它自己总结出这两种类型的图片的不同之处。这就是一种“非监督学习”,在这种学习过程中,我们可以不用提供数据所对应的标签信息,计算机通过观察各种数据之间的特性,会发现这些特性背后的规律。这些规律也就是非监督方法所学到的东西。

3、半监督学习模式:semi-supervised learning
  还有一种方法,综合了监督学习和非监督学习的特征,这种叫作“半监督学习”,它主要考虑如何利用少量有标签的样本和大量的没有标签样本进行训练和分类。

4、遗传算法模式:genetic algorithm
  还有一种和强化学习类似的学习方法,叫做遗传算法。这种方法是模拟我们熟知的进化理论,淘汰弱者,适者生存。通过这样的淘汰机制去选择最优的设计或模型。比如开发者所开发的计算机学会超级玛丽,最开始的马里奥1代可能不久就牺牲了,不过系统会基于1代的马里奥随机生成2代。然后在保存这些代里面最厉害的马里奥。淘汰掉比较弱的马里奥代,然后再次基于强者“繁衍和变异”,生出更强的马里奥,这也就是遗传算法的基本思想。

5、强化学习模式:reinforcement learning

  在规划机器人的行为准则方面,一种机器人学习方法叫作“强化学习”,也就是把计算机丢到一个对于它完全陌生的环境或者让它完成一项从未接触过的任务。它自己回去尝试各种手段。最后让自己成功使用这一个陌生的环境。或者学会完成这件任务的方法途径。比如我想训练机器人去投篮,我们只需要给它一个球。并告诉它你投进了我给你记一分,让它自己去尝试各种各样的投篮方法。在开始阶段,它的命中率可能会非常低。不过它回像人类一样主机总结和学习投篮失败或成功的经验。最后达到很高的命中率。GOOGLE 开发的ALPHAGO 也就是应用了之一种学习方式。

机器学习根据算法类型,可以划分为:

  • 传统统计学习:基于数学模型的机器学习方法。包括SVM、逻辑回归、决策树等。

    这一类算法基于严格的数学推理,具有可解释性强、运行速度快、可应用于小规模数据集的特点。

  • 深度学习:基于神经网络的机器学习方法。包括前馈神经网络、卷积神经网络、递归神经网络等。

    这一类算法基于神经网络,可解释性较差,强烈依赖于数据集规模。但是这类算法在语音、视觉、自然语言等领域非常成功。

没有免费的午餐定理(No Free Lunch Theorem:NFL):对于一个学习算法A,如果在某些问题上它比算法B好,那么必然存在另一些问题,在那些问题中BA更好。

因此不存在这样的算法:它在所有的问题上都取得最佳的性能。因此要谈论算法的优劣必须基于具体的学习问题。

深度学习基础——基本概念和术语整理(代码片段)

文章目录1.人工智能(AI)、机器学习(ML)和深度学习(DL)1.1人工智能1.2机器学习1.3深度学习1.4人工智能、机器学习和深度学习的关系2监督学习与无监督学习3.深度神经网络(deepneuralnetworks,DNN&#x... 查看详情

数学建模暑期集训24:机器学习与classificationlearner工具箱实操(代码片段)

机器学习是比较宽泛的概念,从国赛历年优秀论文来看,机器学习越来越成为优秀论文不可或缺的因素之一。因此,从本篇开始将进入到机器学习的简单应用。此篇博文将简单记录机器学习的一些基础概念、评判标准... 查看详情

《深入浅出图神经网络》gnn原理解析☄学习笔记神经网络基础(代码片段)

...络》GNN原理解析☄学习笔记(二)神经网络基础机器学习基本概念机器学习分类机器学习流程概述常见的损失函数神经网络神经元多层感知器激活函数S型激活函数ReLU及其变种训练神经网络神经网络的运行过程优化困境机... 查看详情

《机器学习实战》-机器学习基础(代码片段)

目录机器学习基础什么是机器学习机器学习应用场景海量数据机器学习的重要性机器学习的基本术语监督学习和非监督学习监督学习:supervisedlearning非监督学习:unsupervisedlearning机器学习工具介绍Python非PythonNumPy函数库基础测试Nu... 查看详情

机器学习数据科学基础——机器学习基础实践(代码片段)

【机器学习】数据科学基础——机器学习基础实践(一)@TOC前言什么是机器学习?机器学习是人工智能领域内的一个重要分支,旨在通过计算的手段,利用经验来改善计算机系统的性能,通常,这里的经验即历史数据。从大量... 查看详情

python机器学习基础知识和相关术语(代码片段)

....1线性函数1.2二次函数或多次函数1.3激活函数2.4对数函数2机器学习的数据结构张量2.1张量的概念2.2标量——0D(阶)张量2.3 向量——1D(阶)张量2.4 矩阵——2D(阶)张量2.5序列数据——3D(阶)... 查看详情

全网最快掌握机器学习之深度学习之神经网络数学基础(附源代码)(代码片段)

个人公众号yk坤帝后台回复机器学习获得源代码1.全文简介要理解深度学习,需要熟悉很多简单的数学概念:张量、张量运算、微分、梯度下降等。本文目的是用不那么技术化的文字帮你建立对这些概念的直觉。特别地... 查看详情

机器学习手册opencv基础操作(代码片段)

前言我前年看过了《Opencv3编程入门》,当时我下的是Opencv4.0.1,所以有些代码用不了就改成了适合早期4.0的代码了,不知道后面的版本的使用方法变了没。我只记得概念特别多,我也看不懂,尽管笔记都做出... 查看详情

machinelearn机器学习及其基础概念简介

机器学习及其基础概念简介作者:白宁超2016年12月23日21:24:51摘要:随着机器学习和深度学习的热潮,各种图书层出不穷。然而多数是基础理论知识介绍,缺乏实现的深入理解。本系列文章是作者结合视频学习和书籍基础的笔记... 查看详情

人工智能初学笔记系列:基础概念与进化流程(代码片段)

...提及人工智能总是伴随着很多新概念和新名词,比如机器学习、深度学习、卷积、RNN、CNN、强化学习等等,很容易就绕晕在了。所以,第一步显示厘清人工智能涵盖的范围、各个概念之间关系、目前的发展情况等。初... 查看详情

机器学习(代码片段)

机器学习(一)1.基本概念训练集,测试集,特征值,监督学习,非监督学习,半监督学习,分类,回归2.概念的学习:人类学习的概念:鸟,车,计算机定义:概念学习是指... 查看详情

机器学习之基础知识(全)(代码片段)

目录1.机器学习概述1.1人工智能概述1.1.1人工智能使用场景1.1.2人工智能小案例1.2 人工智能发展历程1.2.1图灵测试1.2.2发展历程1.2.3小结1.3人工智能主要分支1.3.1 人工智能、机器学习和深度学习1.3.2主要分支介绍1.3.3人工智能发展... 查看详情

机器学习基础---推荐系统(代码片段)

...:问题规划这一章中将讨论推荐系统的有关内容,它是在机器学习中的一个重要应用。机器学习领域的一个伟大思想:对于某些问题,有一些算法可以自动地学习一系列合适的特征,比起手动设计或编写特征更有效率。这是目前... 查看详情

dagger学习--基础概念(代码片段)

目标了解Dagger基本概念官方定义Google对Dagger的定义如下:Daggerisafullystatic,compile-timedependencyinjectionframeworkforbothJavaandAndroid.ItisanadaptationofanearlierversioncreatedbySquareandnowmaintainedbyGoogle.Dagger 查看详情

机器学习基础概念之监督学习与无监督学习

一句话明晰概念:不用编程制定机器做什么,机器有能力自己学习。三种最基础的机器学习算法:决策树、线性回归、K-means聚类。   监督与无监督学习周志华通过敲西瓜案例有以下讲解:监督学习是在敲西瓜听声音... 查看详情

机器学习基本概念总结(代码片段)

1,余弦相似度与欧氏距离1.1,余弦相似度通过对两个文本分词,TF-IDF算法向量化,利用空间中两个向量的夹角,来判断这两个向量的相似程度:(计算夹角的余弦,取值0-1)当两个向量夹角越大,距离越远,最大距离就是两个向量... 查看详情

机器学习数据科学基础——神经网络基础实验(代码片段)

【机器学习】数据科学基础——神经网络基础实验@TOC前言什么是神经网络?神经网络是一门重要的机器学习技术,它是目前人工智能领域内最为火热的研究方向——深度学习技术的基础。神经网络是一种模仿动物神经网络行为... 查看详情

机器学习算法(代码片段)

机器学习常用算法一、线性回归1.基本概念2.代码实现二、逻辑回归1.基本概念Sigmoid预测函数2.代码实现三决策树1.基本概念2.代码实现四支持向量机(SVM)1.基本概念2.代码实现五全连接神经网络DNN1.基本概念全连接神经网... 查看详情