吴恩达《机器学习系列课程》学习笔记:监督学习

唐门教主 唐门教主     2022-10-20     466

关键词:

吴恩达的课程会很偏于用实例来掌握理论知识,不过看着还是有些云里雾里,倒是杉山将的《图解机器学习》介绍得更易懂些。

在此进行结合学习。

杉山将是这么通俗地定义监督学习、无监督学习和强化学习,它们是机器学习的主要种类:
  • 监督学习:

有求知欲的学生从老师那里获取知识、信息,老师提供对错指示、告知最终答案的学习过程。在机器学习里,学生对应于计算机,老师则对应于周围的环境。 根据在学习过程中所获得的经验、技能,对没有学习过的问题也可以做出正确解答,使计算机获得这种泛化能力,是监督学习的最终目标。

监督学习,在手写文字识别、声音处理、图像处理、垃圾邮件分类与拦截、网页检索、基因诊断以及股票预测等各个方面,都有着广泛的引用。

这类机器学习的典型任务包括:预测数值型数据的回归、预测分类标签的分类、预测顺序的排序等。

简单而言,就是初高中时上课,老师上课教知识点讲过程,学生不仅学会了,还能够举一反三。

  • 无监督学习:

在没有老师的情况下,学生自学的过程。

在机器学习里,基本都是计算机在互联网中自动收集信息,并从中获取有用信息。无监督学习不仅仅局限于解决像监督学习那样的有明确答案的问题,因此,它的学习目标可以不必十分明确。

无监督学习在人造卫星故障诊断、视频分析、社交网站解析和声音信号解析等方面大显身手的同时,在数据可视化以及作为监督学习方法的前处理工具方面,也有广泛的应用。

这类机器学习的典型任务有聚类、异常检测等。

  • 强化学习

是指在没有老师提示的情况下,自己对预测的结果进行评估的方法。通过这样的自我评估,学生为了获得老师的最高嘉奖而不断地进行学习。

强化学习被认为是人类主要的学习模式之一。

强化学习,在机器人的自动控制、计算机游戏中的人工智能、市场战略的最优化等方面均有着广泛应用。

在强化学习中经常会用到回归、分类、聚类和降维等各种各样的机器学习算法。

监督学习和无监督学习中的典型任务
  • 回归:把实函数在样本点附近加以近似的有监督的函数近似问题;
  • 分类:对于指定的模式进行识别的有监督的模式识别问题;
  • 异常检测:寻找输入样本中所包含的异常数据的问题;
  • 聚类:与分类问题相同,也是模式识别问题,但是属于无监督学习的一种;
  • 降维:从高维度数据中提取关键信息,将其转换为易于计算的低维度问题进而求解的方法。

第三节:听吴恩达讲监督学习

假设想要预测房价

前不久,一个学生从俄勒冈的波特兰市收集数据,假设绘制了一个数据集,如下所示:

  • 横轴:不同房子的平方英尺
  • 纵轴:代表房子价格,单位是千美元

那么,假设你的朋友有一栋 750 平方英尺的房子,他想要卖掉这个房子,想知道能卖多少钱,学习算法能如何帮助我们?

吴恩达表示,学习算法能做到的一件事就是,根据数据画一条直线,或者说就是用一条直线拟合数据,基于此可以推测房子大概能卖 15 万美元:


不过,这并不是能使用的唯一的学习算法,还有一个更好的:例如除了用一条直线拟合数据,还可以用二次函数或二阶多项式(即二次方程)来拟合数据会更好。

根据二次方程的曲线,如下所示,我们可以在这个点推测出,能卖接近 20 万美元。


那么,摆在面前的有两种方案,如何选择,如何决定?是用直线还是用二次函数来拟合数据?后面会具体讨论。

监督学习是指我们给算法一个数据集,其中包含了正确答案。

在这个例子中,我们给出了一个房价数据集,在这个数据集中每个样本,我们都给出正确的价格,即这个房子的实际卖价。算法的目的就是给出更多的正确答案,例如为朋友想要卖掉的这所房子给出估价。

用更专业的术语定义,这就是「回归问题」。

这里的回归问题指的是:我们想要预测连续的数值输出(即价格),一般房子的价格会记到美分,因此价格实际上是一个离散值,但通常我们认为房价是一个实数、标量或连续值。「回归」这个术语是指我们设法预测连续值的属性。

第二个例子:推测肿瘤良性与否

假设你想看医疗记录,并且设法预测乳腺癌是恶性的还是良性的。假设有人发现了一个乳腺肿瘤,恶性的就是有害并十分危险,良性的就是无害的。我们来看收集到的数据集,假设在数据集中,横轴是肿瘤的尺寸,纵轴 0 和 1 分别代表 No 和 Yes,即不是或是恶性肿瘤,恶性(1),良性(0)。

假设我们的数据集就像这样 —— 在 0 的位置有 5 个样本,在 1 的位置也有 5 个样本。

这时,有个朋友很不幸地患了乳腺肿瘤,假设她的乳腺肿瘤的大小可能在下图这个值的附近,机器学习的问题就是,你能否估计出肿瘤是良性还是恶性的概率?用更专业的术语来讲,这就是一个分类问题。

吴恩达机器学习学习笔记——1.5无监督学习

1无监督学习:在不知道数据点的含义的情况下,从一个数据集中找出数据点的结构关系。2聚类算法:相同属性的数据点会集中分布,聚集在一起,聚类算法将数据集分成不同的聚类。也就是说,机器不知道这些数据点具体是什... 查看详情

斯坦福吴恩达教授机器学习公开课第二讲笔记——有/无监督学习+线性回归

查看详情

吴恩达2014机器学习教程笔记目录

...重实践,结合起来学习事半功倍。但是论经典,还是首推吴恩达的机器学习课程。吴大大14年在coursera的课程通俗易懂、短小精悍,在讲解知识点的同时,还会穿插相关领域的最新动态,并向你推荐相关论文。课程10周共18节课,... 查看详情

机器学习-吴恩达andrewngcoursera学习总结合集,编程作业技巧合集

...learn/machine-learning/home/welcome课程总结机器学习MachineLearning-吴恩达AndrewNg第1~5课总结机器学习MachineLearning-吴恩达AndrewNg第6~10课总结机器学 查看详情

吴恩达机器学习学习笔记——2.1单变量线性回归算法

1回顾1.1监督学习定义:给定正确答案的机器学习算法分类:(1)回归算法:预测连续值的输出,如房价的预测(2)分类算法:离散值的输出,如判断患病是否为某种癌症1.2非监督学习定义:不给定数据的信息的情况下,分析数... 查看详情

斯坦福公开课-机器学习1.机器学习的动机和应用(吴恩达andrewng)

文章目录0三个目标0先修课程要求基本工具1-网址2-邮箱3-本系列课程链接1机器学习的定义1-1非正式定义1-2正式的定义2监督学习(SupervisedLearning)2-1回归问题——连续拟合线(预测房子价格)2-2分类问题——离散数... 查看详情

吴恩达深度学习笔记(代码片段)

监督学习简介文章目录监督学习简介前言一、监督学习常见应用二、基础知识1.数据类型2.学习次序3.常用符号4.二分分类(logistics)5.梯度下降法6.导数和流程图(略)7.logistics中的梯度下降7.向量化的必要性8.向量... 查看详情

吴恩达2022机器学习课程评测来了!

大家好!我是louwill。吴恩达老师2022年机器学习专项课(MachineLearningSpecialization)上周全新来袭,课程本身并不是新课,与10年前的机器学习专项课相比,编程语言用Python代替了此前的Octave,主要定位于... 查看详情

花了2晚,拿到了吴恩达@斯坦福大学的机器学习课程证书

花了2个晚上,拿到了吴恩达@斯坦福大学的机器学习课程证书警告⚠️⚠️⚠️请认真阅读此文,操作不慎可能血亏真金白银吴恩达算是我的精神导师了,很早之前就是看他的视频入门机器学习。他的经典课程《机器学习》2012年... 查看详情

吴恩达机器学习学习笔记——代价函数

单变量线性回归函数 hθ(x)=θ0+θ1x为了使线性回归函数对数据有较好的预测性,即y到h(x)的距离都很小。  查看详情

吴恩达“机器学习”——学习笔记二

定义一些名词欠拟合(underfitting):数据中的某些成分未被捕获到,比如拟合结果是二次函数,结果才只拟合出了一次函数。过拟合(overfitting):使用过量的特征集合,使模型过于复杂。参数学习算法(parametriclearningalgorithms)... 查看详情

吴恩达机器学习笔记(代码片段)

文章目录ErroranalysisMethodstosolveoverfittingMethodstosolveunderfittingRecommendapproachErrormetricsforskewedclassesDataformachinelearningSupportVectorMachineK-meansPrincipleComponentAnalysisDatapreproce 查看详情

吴恩达《机器学习》章节1绪论:初识机器学习

1、欢迎参加《机器学习》 2、什么是机器学习?机器学习(MachineLearning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获... 查看详情

吴恩达-深度学习-课程笔记-6:深度学习的实用层面(week1)

1训练/验证/测试集(Train/Dev/testsets)构建神经网络的时候有些参数需要选择,比如层数,单元数,学习率,激活函数。这些参数可以通过在验证集上的表现好坏来进行选择。前几年机器学习普遍的做法:把数据分成60%训练集,20%验... 查看详情

斯坦福机器学习课程汇总

斯坦福机器学习课程汇总前言首先感谢吴恩达建立Coursera这样一个优秀的在线学习平台,以及他发布在这个平台上的机器学习课程。这门课程将整个机器学习领域的基础知识,用浅显易懂的方式,深入浅出的进行了介绍。使得一... 查看详情

斯坦福公开课-机器学习1.机器学习的动机和应用(吴恩达andrewng)

文章目录0三个目标0先修课程要求基本工具1-网址2-邮箱3-本系列课程链接1机器学习的定义1-1非正式定义1-2正式的定义2监督学习(SupervisedLearning)2-1回归问题——连续拟合线(预测房子价格)2-2分类问题——离散数... 查看详情

斯坦福公开课-机器学习2.监督学习应用-梯度下降(吴恩达andrewng)(代码片段)

文章目录1线性代数(linearalgebra)1-1符号(Notation)1-2例子——房价预测1-3假设函数(hypothesis)1-3-3用`线性代数-非齐次方程`解释参数**1-普通梯度下降算法****2-批梯度下降算法(batchgradientdescentalgo... 查看详情

吴恩达深度学习课程第三课—结构化机器学习项目

第一周机器学习策略1.1什么是机器学习策略1.2正交化功能点之间相互独立1.3单一数字评估指标调和平均数1.4满足和优化指标N个指标,满足N-1个指标的前提下优化那一个指标1.5训练,开发,测试数据集划分训练集,开发集,测试... 查看详情