机器学习预备知识之概率论(下)

skyWalker_ONLY skyWalker_ONLY     2022-12-09     287

关键词:

期望值和方差

随机变量的期望值E(X),也称为平均数或者均值,使用下面的公式计算,这两个公式分别用于计算离散随机变量和连续随机变量的期望值:


使用上面的公式计算指示器变量(取值要么为1要么为0的随机变量)可得:

下面是与期望有关的两个重要定理,第一个是期望的线性性质:

无论随机变量是否相互独立,期望的线性性质都成立。而第二个定义只有在随机变量相互独立时才成立:

期望其它重要的性质还有:如果C是常数则E(C)=C,E(CX)=CE(X)。

方差用于衡量一个分布的离散程度,使用下面的公式计算方差:

通常使用 表示方差,使用 表示标准差,标准差和方差的关系为: 

在已知随机变量X的期望时,可以通过下面的公式快速的计算X的方差:


上述推导过程利用了期望的线性性质以及如果C是常数则E(C)=C,E(CX)=CE(X)(此处C为E(X))。方差不是随机变量的线性函数,比如:


如果随机变量X和Y相互独立,那么有下面的关系:


两个随机变量的协方差定义如下,协方差表示两个随机变量的相关程度:


伯努利、泊松和高斯分布

伯努利分布是最基本的分布之一,服从伯努利分布的随机变量X只能取两个值0和1,通常使用p表示X取值为1的概率,即p=P(X=1),q为X取值为0的概率,即q= P(X=0)=1-p。由于X只能取值0和1,因此常用语表示试验是否成功。由定义可知伯努利的分布为:


还可以将上面公式概括为:。伯努利分布的期望和方差分别为p和p(1-p),计算过程如下:


泊松分布是处理事件发生的非常有用的分布,适合于描述单位时间内随机事件发生的次数的概率分布。如某一服务设施在一定时间内受到的服务请求的次数,电话交换机接到呼叫的次数、汽车站台的候客人数、机器出现的故障数、自然灾害发生的次数、DNA序列的变异数、放射性原子核的衰变数等。

泊松分布的参数λ是单位时间(或单位面积)内随机事件的平均发生率,泊松分布的质量函数为:

期望和方差都为λ,计算过程如下:


在上述的推导过程中用到了一个重要的公式:

高斯分布也称为正态分布,是最常使用的分布之一,比如可以在试验次数非常大时用于近似的表示二项式分布,或者在平均发生率很高时近似表示泊松分布,还与大数定理有关。高斯分布由两个参数决定:期望µ和方差σ2,其公式如下:


下图为高斯分布的示例图,从该图中可以得知:期望决定正态曲线的中心位置,方差决定正态曲线的陡峭或扁平程度。方差越小,曲线越陡峭;方差越大,曲线越扁平。



在机器学习中经常会处理多变量的高斯分布,k维多变量的高斯分布可以使用参数(µ,Σ)表示,其中µ为期望值的k维向量,Σ为kxk协方差矩阵,其中Σii=Var(Xi),Σij= Cov(X i,X j)。多变量高斯分布的概率密度函数为:


机器学习基础知识之概率论基础详解

机器学习基础知识之概率论基础详解文章目录机器学习基础知识之概率论基础详解引言一、随机事件以及其运算1、样本空间的概念2、随机事件3、随机变量4、事件之间的关系4.1包含关系4.2相等关系4.3互不相容5、事件间的运算5.1... 查看详情

机器学习基础知识之概率论的matlab描述概率的图像

机器学习基础知识之概率论的Matlab描述概率的图像(三)文章目录机器学习基础知识之概率论的Matlab描述概率的图像(三)一、引言二、具体的案例1、截尾均值2、内四分极值![在这里插入图片描述](https://img.songbin... 查看详情

机器学习基础知识之概率论的随机变量及其分布

❤️机器学习基础知识❤️之概率论的❤️随机变量及其分布❤️文章目录❤️机器学习基础知识❤️之概率论的❤️随机变量及其分布❤️一、随机变量以及其分布1、连续变量2、离散变量3、概率密度二、随机变量的数学期望... 查看详情

机器学习基础知识之概率论的随机变量及其分布

❤️机器学习基础知识❤️之概率论的❤️随机变量及其分布❤️文章目录❤️机器学习基础知识❤️之概率论的❤️随机变量及其分布❤️一、随机变量以及其分布1、连续变量2、离散变量3、概率密度二、随机变量的数学期望... 查看详情

机器学习基础知识之概率论的matlab描述概率的图像

机器学习基础知识之概率论的Matlab描述概率的图像(二)文章目录机器学习基础知识之概率论的Matlab描述概率的图像(二)一、引言二、实际的Matlab的应用1、F分布2、泊松分布3、指数分布4、均匀分布5、二项分布6... 查看详情

机器学习基础知识之概率论的matlab描述概率的图像

机器学习基础知识之概率论的Matlab描述概率的图像(二)文章目录机器学习基础知识之概率论的Matlab描述概率的图像(二)一、引言二、实际的Matlab的应用1、F分布2、泊松分布3、指数分布4、均匀分布5、二项分布6... 查看详情

机器学习基础知识之概率论的matlab描述概率的图像

机器学习基础知识之概率论的Matlab描述概率的图像(一)(由于有很多的分布,而且还有一维分布以及多维分布,因此,我们一篇博文写下来的话内容量太大,文章太长,因此,我们分三次写完... 查看详情

2.自然语言处理预备知识

...练掌握Python 微积分,线性代数(MATH51,CME100)基本的概率论和统计(CS109)机器学习基础(CS229)自然语言处理参考书DanJurafskyandJamesH.Martin. SpeechandLanguageProcessing(3rded.draft) [link]YoavGoldberg. APrimer 查看详情

深度学习预备知识

...习预备知识1、基础数学知识(线性代数、高等数学、概率论部分知识)•导数概念、如何求导、•矩阵概念、矩阵基本运算、•概率的概念、正态分布的概念等【注意】以上内容入门深度学习足够,强烈不建议大家... 查看详情

机器学习中有关概率论知识的小结

...近写了许多关于机器学习的学习笔记,里面经常涉及概率论的知识,这里对所有概率论知识做一个总结和复习,方便自己查阅,与广大博友共享,所谓磨刀不误砍柴工,希望博友们在这篇博文的帮助下࿰... 查看详情

可解释性机器学习task01-预备知识

可解释性机器学习task01-预备知识文章目录可解释性机器学习task01-预备知识什么是可解释人工智能?为什么要学可解释性的一些交叉研究方向MachineTeaching细粒度图像分类AI安全/对抗样本前沿AI方向本身具有可解释性的学习一些可解... 查看详情

(d2l-ai/d2l-zh)《动手学深度学习》pytorch笔记前言(介绍各种机器学习问题)以及数据操作预备知识ⅲ(概率)(代码片段)

开源项目地址:d2l-ai/d2l-zh教材官网:https://zh.d2l.ai/书介绍:https://zh-v2.d2l.ai/笔记基于2021年7月26日发布的版本,书及代码下载地址在github网页的最下面交流者论坛额外:https://distill.pub/pytorch中文文档(哪个... 查看详情

机器学习算法集锦

...习机器学习(MachineLearning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之... 查看详情

预备知识

...别转换、自动填色、增强分辨率、图像移植、图像修复】机器人、九歌、人工智能解说、医学诊断【Waston】、智能交通、无人驾驶弱人工智能、强人工智能、图灵测试三次浪潮2、人工智能、机器学习、深度学习之间的关系 ... 查看详情

机器学习简介

...念机器学习(MachineLearning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论等理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能... 查看详情

机器学习

1、概念:多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度等多门学科。专门研究计算机怎样模拟学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。2、学科定位:人工... 查看详情

机器学习中涉及的概率论知识回顾

1.常见分布的期望与方差 2.二维随机变量的数字特征:相关系数:协方差矩阵及性质  查看详情

机器学习综述

...器学习(MachineLearning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结... 查看详情