协方差矩阵与相关系数矩阵(代码片段)

夏小悠 夏小悠     2022-12-28     385

关键词:

文章目录

前言

  本篇博客主要介绍一下方差、协方差及相关系数的相关知识,进而引入了协方差矩阵与相关系数矩阵,并结合相关实例进行说明。

1. 方差、协方差与相关系数

  在《概率论与数理统计》中,方差用来度量单个随机变量 X X X的离散程度,记为 D X DX DX,计算公式如下:
D X = E ( X − E X ) 2 = E X 2 − E 2 X \\beginaligned DX &= E(X-EX)^2 \\\\[3pt] &= EX^2 - E^2X \\endaligned DX=E(XEX)2=EX2E2X  数学表达式为: σ 2 ( x ) = 1 n − 1 ∑ i = 1 N ( x i − x ˉ ) 2 \\sigma ^2(x) = \\frac 1 n-1\\sum _i=1 ^N (x_i - \\bar x)^2 σ2(x)=n11i=1N(xixˉ)2

  即方差 = 平方的期望 - 期望的平方

  协方差用来度量两个随机变量 X X X Y Y Y间的相似程度,记为 C o v ( X , Y ) Cov(X,Y) Cov(X,Y),计算公式为:
C o v ( X , Y ) = E [ ( X − E X ) ⋅ ( Y − E Y ) ] = E ( X Y ) − E X ⋅ E Y \\beginaligned Cov(X,Y) &= E[(X - EX) \\cdot (Y - EY)] \\\\[3pt] &= E(XY) - EX \\cdot EY \\endaligned Cov(X,Y)=E[(XEX)(YEY)]=E(XY)EXEY  数学表达式为: σ ( x , y ) = 1 n − 1 ∑ i = 1 N ( x i − x ˉ ) ( y i − y ˉ ) \\sigma (x, y) = \\frac 1 n-1\\sum _i=1 ^N (x_i - \\bar x) (y_i - \\bar y) σ(x,y)=n11i=1N(xixˉ)(yiyˉ)

  从公式上来看,协方差是两个变量与自身期望做差再相乘,然后对乘积取期望。也就是说,当其中一个变量的取值大于自身期望,另一个变量的取值也大于自身期望时,即两个变量的变化趋势相同,此时,两个变量之间的协方差取正值。反之,即其中一个变量大于自身期望时,另外一个变量小于自身期望,那么这两个变量之间的协方差取负值。

  相关系数,也叫皮尔逊(Pearson)相关系数,用来度量两个随机变量 X X X Y Y Y间的相关程度,记为 ρ X Y \\rho_XY ρXY,计算公式为:
ρ X Y = C o v ( X , Y ) D X D Y \\rho_XY = \\frac Cov(X,Y) \\sqrt DX \\sqrt DY ρXY=DX DY Cov(X,Y)  若 ρ X Y > 0 \\rho_XY > 0 ρXY>0,表示随机变量 X X X Y Y Y呈正相关;
  若 ρ X Y < 0 \\rho_XY < 0 ρXY<0,表示随机变量 X X X Y Y Y呈负相关;
  若 ρ X Y = 0 \\rho_XY = 0 ρXY=0,表示随机变量 X X X Y Y Y不相关,即相互独立;
  若 ρ X Y = ± 1 \\rho_XY = \\pm1 ρXY=±1,表示随机变量 X X X Y Y Y呈线性相关;

  相关系数也可以看成协方差:一种剔除了两个变量量纲影响、标准化后的特殊协方差,它消除了两个变量变化幅度的影响,而只是单纯反应两个变量每单位变化时的相似程度。

2. 协方差矩阵

  在实际场景中,我们在描述一个物体时,并不会单单从一个或两个维度去描述,比如说,在描述一个神经网络模型的性能时,需要从模型的大小,精度,推理时间等多个维度来衡量。在进行多维数据分析时,不同维度之间的相关程度就需要协方差矩阵(covariance matrix)来描述,维度之间的两两相关程度就构成了协方差矩阵,而协方差矩阵主对角线上的元素即为每个维度上的数据方差。
  协方差矩阵的表达式为: ∑ = [ σ ( x 1 , x 1 ) … σ ( x 1 , x n ) ⋮ ⋱ ⋮ σ ( x n , x 1 ) … σ ( x n , x n ) ] \\sum = \\beginbmatrix \\sigma (x_1, x_1) & \\dots & \\sigma (x_1, x_n) \\\\ \\vdots & \\ddots & \\vdots \\\\ \\sigma (x_n, x_1) & \\dots & \\sigma (x_n, x_n) \\\\ \\endbmatrix = σ(x1,x1)σ(xn,x1)σ(x1,xn)σ(xn,xn)

3. 相关系数矩阵

  顾名思义,就是由相关系数组成的矩阵(correlation matrix),也叫系数矩阵,矩阵中的每个元素的取值范围为[-1, 1]
  相关系数矩阵的表达式为: C = [ ρ ( x 1 , x 1 ) … ρ ( x 1 , x n ) ⋮ ⋱ ⋮ ρ ( x n , x 1 ) … ρ ( x n , x n ) ] = [ 1 … ρ ( x 1 , x n )

求相关系数矩阵(代码片段)

...“城市”列为索引列xishu=data.corr()print(data.corr())#相关系数矩阵,即给出了任意两款菜式之间的相关系数print("显示“城市火灾”与其他的相关系数:")print(data.corr()[u‘森林火灾‘])#只显示“森林火灾”与其他菜式的相关系数cityfire=d... 查看详情

python与数据分析numpy数值计算基础——补充(代码片段)

...查看矩阵特征4.矩阵乘法5.计算相关系数矩阵6.计算方差、协方差、标准差7.行列扩展8.常用变量9.矩阵在不同维度上的计算10.应用(1)使用蒙特·卡罗方法估计圆周率的值(2)复利计算公式三、计算特征值与正特征... 查看详情

协方差矩阵怎么求?

参考技术A问题一:如何求协方差矩阵用软件求啊,MATLAB功能很强大,甚至EXCLE也能求的,不会命令的话,打开帮助菜单搜索下就可以找到。问题二:excel怎么算协方差矩阵wenku.baidu/...2这个文档逐步逐步教的,有例子问题三:怎么... 查看详情

numpy数组与矩阵运算(代码片段)

...转置查看矩阵特性矩阵乘法计算相关系数矩阵计算方差、协方差、标准差计算特征值与特征向量计算逆矩阵求解线性方程组奇异值分解函数向量化矩阵生成与常用操作矩阵生成扩展库numpy中提供的matrix()函数可以用来把列表、元... 查看详情

向量与矩阵导数和偏导数特征值与特征向量概率分布期望方差相关系数

文章目录向量与矩阵标量、向量、矩阵、张量向量范数和矩阵的范数导数和偏导数特征值和特征向量概率分布伯努利分布正态分布(高斯分布)指数分布期望、⽅差、协⽅差、相关系数期望方差协⽅差相关系数向量与矩... 查看详情

matlab中已知协方差矩阵,怎样算相关系数?

参考技术A计算方法如下:假设协方差矩阵为c第i行与第j行的相关系数为:r(i,j)=c(i,j)/sqrt(c(i,i)*c(j,j))若要求整个矩阵可用循环实现[m,n]=size(c);fori=1:mforj=1:nr(i,j)=c(i,j)/sqrt(c(i,i)*c(j,j));endMATLAB是matrix&laboratory两个词的组合,意为矩阵... 查看详情

机器学习数学基础总结(代码片段)

...率与独立事件1.2联合概率分布二、期望三、方差3.1方差3.2协方差与相关系数3.3协方差矩阵四、大数定律及中心极限定理4.1切比雪夫不等式4.2大数定理4.3中心极限定理五、不确定性来源六、常见概率分布6.1均匀分布6.2二项分布6.3高... 查看详情

如何快速绘制相关系数矩阵(代码片段)

importpandasaspdtrain=pd.read_csv("dftest/train.csv")importseabornassnsimportmatplotlib.pyplotaspltdefshowcov(df):dfData=df.corr()plt.subplots(figsize=(9,9))#设置画面大小sns.heatmap(dfData,annot=True,vmax=1 查看详情

根据矩阵的二维相关系数进行ocr识别(代码片段)

我想通过简单的模板匹配来进行图像识别。把预处理好的字符图片,分别与A到Z的样本图片进行模板匹配。结果最大的表明相关性最大,就可以识别字符图片了。在实际应用中,我用了openCV的matchTemplate()函数,但... 查看详情

matlab|好看的相关系数矩阵图绘制(代码片段)

...#xff0c;如果有用的话点赞,转发走起~绘制超好看的相关系数矩阵图!工具函数由于过长将放在最后展示,以下先展示使用方式和绘制效果:使用效果使用教程0数据准备数据就多列的数值矩阵即可:X=[-2.8461-0.9470-0.... 查看详情

excel公式correl算出相关系数

...示应用到每对可能的测量变量的CORREL函数值。相关系数与协方差相似,是两个测量变量之间关联变化程度的指标。与协方差不同的是,相关系数是比例值 查看详情

人工智能学习线路

...率论基础古典模型常见概率分布大数定理和中心极限定理协方差(矩阵)和相关系数最大似然估计和最大后验估计3.线性代数及矩阵线性空间及线性变换矩阵的基本概念状态转移矩阵特征向量矩阵的相关乘 查看详情

方差variance,协方差covariance,协方差矩阵covariancematrix

参考:如何通俗易懂地解释「协方差」与「相关系数」的概念?(非常通俗易懂)浅谈协方差矩阵方差(variance)集合中各个数据与平均数之差的平方的平均数。在概率论与数理统计中,方差(Variance)用来度量随机变量和其数... 查看详情

python遥感图像处理应用篇(二十四):python绘制遥感图像各波段热力图(相关系数矩阵)(代码片段)

...各个波段绘制热力图,首先需要计算波段之间的相关系数矩阵,而计算遥感图像波段相关系数矩阵有不同的方法,常用的我们可以采用遥感图像处理软件计算,比如ENVI软件就可以计算相关系数矩阵,使用工具箱中的Statistics工具... 查看详情

python遥感图像处理应用篇(二十四):python绘制遥感图像各波段热力图(相关系数矩阵)(代码片段)

...各个波段绘制热力图,首先需要计算波段之间的相关系数矩阵,而计算遥感图像波段相关系数矩阵有不同的方法,常用的我们可以采用遥感图像处理软件计算,比如ENVI软件就可以计算相关系数矩阵,使用工具箱中的Statistics工具... 查看详情

matlab如何求相关系数

...计算公式是:C(1,2)/SQRT(C(1,1)*C(2,2)),其中C表示矩阵[f,g]的协方差矩阵,假设f和g都是列向量(这两个序列的长度必须一样才能参与运算),则得到的(我们感兴趣的部分)是一个数。以默认的A=corrcoef(f,g)为例,输出A是一个二维矩... 查看详情

概率论与数理统计基本概念随机变量的数字特征

...p; 2.2标准化变量 重要性质 2.3切比雪夫不等式3协方差与相关系数3.1协方差、相关系数  4矩、协方差矩阵4.1原点矩、中心矩、混合矩、混合中心矩4.2协方差矩阵4.2.1二维  4.2.2n维  查看详情

关于协方差矩阵需要注意的一个事项

协方差矩阵是衡量样本的属性(即维度)之间的关系,而不是样本与样本之间的关系。比如有100个样本,每个样本10个属性,那么计算得到的协方差矩阵一定是10*10的,而不是100*100的,这个一定要注意。协方差矩... 查看详情