正文

斯坦福2014机器学习笔记一----基本概念

嗜血的草  嗜血的草  2022-09-23  734

关键词：

　　一、纲要

　　　　机器学习的定义

　　　　监督学习(supervised learning)和无监督学习(unsupervised learning)

　　　　回归问题(regression problem)与分类问题(classification problem)

　　　　鸡尾酒宴问题

　　　　单变量线性回归问题

　　二、概念介绍

　　1.什么是机器学习？

　　一个叫Tom的人对机器学习的定义为：一个程序被认为能从经验E中学习，解决任务T，达到性能P，当且仅当，有了经验E之后，经过度量P的评判，程序在处理T的性能有所提升。这个定义中有三个量：经验E，任务T和度量P。这里引用视频中的一个例子可以更通俗的理解机器学习：一个并不擅长跳棋的人编写了一个跳棋程序，这个程序的牛逼之处在于在他跟程序下了N盘棋之后，程序可以通过观察哪种棋局会赢，哪种棋局会输，从而学习好的布局，这段程序的下棋水平也就越来越高。这就很像之前的AlphaGo，也正是这个AlphaGo，让AI火的一塌糊涂。

　　2.监督学习与无监督学习

　　监督学习就是我们教计算机如何做事情，我们给出一个数据集，然后给出正确答案。

　　无监督学习就是计算机自己学习怎么做事情，只有一个数据集，计算机自己去找出一种结构。

　　举个例子：有一堆邮件，我们把这看成是一个数据集，如果我们让计算机把这堆邮件分成普通邮件和垃圾邮件(spam)，这是监督学习还是无监督学习？答案是监督学习，因为我们给定了“答案”即分成普通邮件和垃圾邮件。那无监督学习该怎么描述呢？我们让计算机自己去处理这些邮件中，处理的结果可能是将这些邮件分为两类，普通邮件和垃圾邮件。这其实是一种聚类算法。

　　聚类算法的另一个例子：Google每天搜索成千上万条新闻，然后自动的把他们分成不同的专题，这也属于无监督学习、聚类算法

　　3.回归问题与分类问题

　　回归问题即预测连续的输出值，而分类问题是预测离散的输出值。这里的连续跟离散是什么意思呢？还是用例子说明。如果我们需要出售房屋，自变量是房屋的面积，因变量(输出值)是房屋的价格，那么这个输出值就是连续的。作为对比说明离散值，我们需要根据肿瘤的尺寸预测肿瘤是良性的还是恶性的，那输出值就只有0(恶性)和1(良性)两种，这就是离散的，也就是分类问题。

　　4.鸡尾酒宴问题

　　这个问题我一看到的时候就感觉非常有趣，说的是什么呢？在鸡尾酒宴上，屋子里坐满了人，大家同时都在说话，这是一个复杂的场景，我们将它进行简化到只有两个人，如图

　　由于两个人离麦克风的距离不同，所以麦克风接收到的声音的强度是不同的(这是我自己找的“结构”，并不是程序给定了“答案”，所以这也是一种无监督学习的算法)，但两段声音是叠加的。利用无监督学习的算法，我们就可以将两个人的声音分离出来。当我听到这个输出的结果的时候，我是整个人被惊艳到了，这是多么的智能啊！

　　5.单变量线性回归问题

　　这部分就以视频中的房价的例子来说明。首先说明这是一个监督学习(supervised learning)问题，因为我们给了“答案”：单变量、线性。推导过程我用手写方式展示：

以上就是我10月17日学习机器学习的笔记......

斯坦福机器学习课程笔记

模型（如何模拟）---策略（风险函数）--算法（最优化方法）第一节:机器学习的基本概念和分类第二节：线性回归，最小二乘批梯度下降(bgd)和随机梯度下降(sgd)第三节:过拟合，欠拟合非参数学习算法：局部加权回归概率角度解... 查看详情

斯坦福2014机器学习笔记六----神经网络

一、纲要　　神经网络模型表示　　神经网络的直观理解　　神经网络做多类分类二、内容详述　　1、神经网络模型表示　　这里就不再描述大脑的神经网络和神经元了，我们直接看神经网络的模型。我们先从最简单的神... 查看详情

斯坦福2014机器学习笔记九----支持向量机

一、纲要　　支持向量机基础及优化目标　　支持向量机的直观理解　　核函数二、内容详述　　1、支持向量机基础以及优化目标　　支持向量机(SupportVectorMachine)与逻辑回归和神经网络相比，在学习复杂的非线性方程时提供了... 查看详情

斯坦福2014机器学习笔记五----正则化

斯坦福机器学习视频笔记week3logisticregressionandregularization

我们将讨论逻辑回归。逻辑回归是一种将数据分类为离散结果的方法。例如，我们可以使用逻辑回归将电子邮件分类为垃圾邮件或非垃圾邮件。在本模块中，我们介绍分类的概念，逻辑回归的损失函数（costfuncton），以及逻辑回... 查看详情

人工智能学习笔记----02

...笔记----02文章目录人工智能学习笔记----02一、人工智能、机器学习、深度学习二、一些基本概念Jupyter一、人工智能、机器学习、深度学习机器学习是人工智能的重要分支深度学习是机器学习的重要分支二、一些基本概念我们日... 查看详情

（笔记）斯坦福机器学习第五讲--生成学习算法

本讲内容1.Generativelearningalgorithms（生成学习算法）2.GDA（高斯判别分析）3.NaiveBayes（朴素贝叶斯）4.LaplaceSmoothing（拉普拉斯平滑） 1.生成学习算法与判别学习算法判别学习算法：直接学习或者学习一个假设&n... 查看详情

斯坦福机器学习视频笔记week6关于机器学习的建议adviceforapplyingmachinelearning

我们将学习如何系统地提升机器学习算法，告诉你学习算法何时做得不好，并描述如何‘调试‘你的学习算法和提高其性能的“最佳实践”。要优化机器学习算法，需要先了解可以在哪里做最大的改进。我们将讨论如何理解具有... 查看详情

斯坦福大学andrewng-机器学习笔记--机器学习算法的选择与评估

　　大概用了一个月，AndrewNg老师的机器学习视频断断续续看完了，以下是个人学习笔记，入门级别，权当总结。笔记难免有遗漏和误解，欢迎讨论。　　鸣谢：中国海洋大学黄海广博士提供课程视频和个人笔记，在此深表感谢... 查看详情

（笔记）斯坦福机器学习第四讲--牛顿法

本讲内容1.Newton‘smethod（牛顿法）2.ExponentialFamily（指数簇）3.GeneralizedLinearModels(GLMs)（广义线性模型） 1.牛顿法假如有函数,寻找使得牛顿法的步骤如下：(1)initialize assomevalue.上图中用初始化的值(2)在这一... 查看详情

斯坦福吴恩达教授机器学习公开课第二讲笔记——有/无监督学习+线性回归

查看详情

斯坦福大学andrewng-机器学习笔记--异常检测

coursera公开课笔记:斯坦福大学机器学习第七课“正则化”

Coursera公开课笔记:斯坦福大学机器学习第七课“正则化”NLPJob斯坦福大学机器学习第七课”正则化“学习笔记，本次课程主要包括4部分：1)TheProblemofOverfitting(过拟合问题)2)CostFunction(成本函数)3)RegularizedLinearRegression(线性回归的正... 查看详情

（笔记）斯坦福机器学习第六讲--朴素贝叶斯

本讲内容1.NaiveBayes（朴素贝叶斯）2.Eventmodels（朴素贝叶斯的事件模型）3.Neuralnetwork（神经网络）4.Supportvectormachines（支持向量机） 1.朴素贝叶斯上讲中的垃圾邮件问题有几个需要注意的地方：（1）一个单词只有出现... 查看详情

斯坦福大学andrewng-机器学习笔记--神经网络模型

斯坦福大学andrewng-机器学习笔记--聚类&降维

（笔记）斯坦福机器学习第七讲--最优间隔分类器

本讲内容1.Optionalmarginclassifier（最优间隔分类器）2.primal/dualoptimization（原始优化问题和对偶优化问题）KKTconditions（KKT条件）3.SVMdual（SVM的对偶问题）4.kernels（核方法） 1.最优间隔分类器对于一个线性可分的训练集合，最优间... 查看详情

斯坦福吴恩达教授机器学习公开课第四讲笔记——牛顿方法/广义线性模型

查看详情