manteltest是对两个矩阵相关关系的检验(代码片段)

大漠胡天 大漠胡天     2022-12-26     270

关键词:

Mantel test 是对两个矩阵相关关系的检验,由Nathan Mantel在1976年提出。之所以抛开相关系数发展这样一种方法,是因为相关系数只能处理两列数据之间的相关性,而在面对两个矩阵之间的相关性时就束手无策。Mantel检验专治这种不服。

这种方法多用于生态学上,不同的样本case对应不同的变量,而不同的变量可以分属不同的类别,对case有不同角度的刻画。如基于不同植物种类数量可以建立样本间的两两距离矩阵,只需套用距离计算公式即可;不同样本的微生物clone序列,通过Unifrac方法也可以计算得到样本间距离矩阵;不同位置,两两间距离也可以用距离表示。所得到这些矩阵,如果希望验证两类描述间有没有相关关系,就非常有用了。比如我希望检验微生物群落是否和植被群落有对应关系,就可以将微生物Unifrac矩阵对植物的比如Bray-Curtis距离矩阵做个相关分析,由得到的结果得出自己的推论。这种方法的好处在于,不管你是什么数据,只要能计算有距离属性的值,都可以转化为距离矩阵进行分析

Mantel test,顾名思义,是一种检验。既然是检验就得有原假设,它的原假设是两个矩阵见没有相关关系。检验过程如下:两个矩阵都对应展开,变量两列,计算相关系数(理论上什么相关系数都可以计算,但常用pearson相关系数),然后其中一列或两列同时置换,再计算一个值,permutation 成千上万次,看实际的r值在所得r值分布中的位置,如果跟随机置换得到的结果站队较近,则不大相关,如果远远比随机由此得到显著性。

 

如图,得到的值在这个区域,说明跟随机出现的数值比较接近,因此

$z.stat
[1] 6.009877

$p
[1] 0.519

这里使用的是z统计量,不是r,使用的ape包里的mantel.test()函数。

The function calculates a Z-statistic for the Mantel test, equal to the sum of the pairwise product of the lower triangles of the permuted matrices, for each permutation of rows and columns. It compares the permuted distribution with the Z-statistic observed for the actual data.

 

 然后用vegan算,用r统计量,得到差不多的结果,也是不显著。

> mantel(q1,q2)

Mantel statistic based on Pearson\'s product-moment correlation

Call:
mantel(xdis = q1, ydis = q2)

Mantel statistic r: 0.169
     Significance: 0.279

Empirical upper confidence limits of r:
  90%   95% 97.5%   99%
0.351 0.425 0.516 0.597

Based on 999 permutations
但是不同相关方法会对结果造成很大的影响,

> mantel(veg.dist, env.dist)

Mantel statistic based on Pearson\'s product-moment correlation

Call:
mantel(xdis = veg.dist, ydis = env.dist)

Mantel statistic r: 0.3047
     Significance: 0.001

Empirical upper confidence limits of r:
  90%   95% 97.5%   99%
0.113 0.150 0.174 0.215

Based on 999 permutations

> mantel(veg.dist, env.dist, method="spear")

Mantel statistic based on Spearman\'s rank correlation rho

Call:
mantel(xdis = veg.dist, ydis = env.dist, method = "spear")

Mantel statistic r: 0.2838
     Significance: 0.001

Empirical upper confidence limits of r:
  90%   95% 97.5%   99%
0.126 0.160 0.187 0.223

Based on 999 permutations

此处我的理解是:这说明对矩阵也需要检验其分布假设,不符合分布假设的条件下用spearman秩相关更靠谱。偏mantel相关函数包括三个变量(矩阵),即控制第三个矩阵影响下前两个矩阵的相关性。

 

进一步关于Mantel correlogram。这种方法基于上述相关系数,不过其中一个矩阵换成了设计好的不同距离矩阵,分析相关性,得到不同距离下某多元变量组与之相关性的结果。

> mite.correlog = mantel.correlog(mite.hel.D, XY=mite.xy, nperm=999)
> mite.correlog  

Mantel Correlogram Analysis

Call:
 
mantel.correlog(D.eco = mite.hel.D, XY = mite.xy, nperm = 999)

       class.index    n.dist Mantel.cor Pr(Mantel) Pr(corrected)   
D.cl.1    0.514182 358.000000  0.135713     0.001        0.001 ***
D.cl.2    1.242546 650.000000  0.118174     0.001        0.002 **
D.cl.3    1.970910 796.000000  0.037820     0.052        0.052 . 
D.cl.4    2.699274 696.000000 -0.098605     0.001        0.004 **
D.cl.5    3.427638 500.000000 -0.112682     0.001        0.005 **
D.cl.6    4.156002 468.000000 -0.107603     0.001        0.006 **
D.cl.7    4.884366 364.000000 -0.022264     0.134        0.134   
D.cl.8    5.612730 326.000000        NA        NA           NA   
D.cl.9    6.341094 260.000000        NA        NA           NA   
D.cl.10   7.069458 184.000000        NA        NA           NA   
D.cl.11   7.797822 130.000000        NA        NA           NA   
D.cl.12   8.526186 66.000000        NA        NA           NA   
D.cl.13   9.254550 32.000000        NA        NA           NA   
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

A table with the distance classes as rows and the class indices, number of distances per class, Mantel statistics (computed using Pearson\'s r, Spearman\'s r, or Kendall\'s tau), and p-values as columns. A positive Mantel statistic indicates positive spatial correlation. An additional column with p-values corrected for multiple testing is added unless mult="none".

这种方法多用于空间分析中,用于表征不同尺度下某多元变量的变化趋势。我还没有见过用到dna数据上的,可以考虑写个东西。

基本就这些吧,见到有新鲜应用再讨论。

白话“卡方检验”

参考技术A卡方检验是假设检验的一种,用于分析两个类别变量的相关关系,是一种非参数假设检验,得出的结论无非就是“两个变量相关”或者“两个变量”不相关,所以有的教材上又叫“独立性检验”。如果不是很清楚“假... 查看详情

gwas相关知识

...这两个概念有点混淆,后来明白过来了。这两个概念一个是对基因频率进行的筛选,一个是对基因型频率进行的筛选。对于一个位点“AAATTT”,其中A的频率为基因频率,AA为基因型频率。MAF直接是对基因频率进行筛选,而哈温平... 查看详情

在回归分析中,f检验和t检验各有啥作用?

...可以用t检验、巴特勒特检验等取代。扩展资料回归分析是对具有因果关系的影响因素(自变量)和预测对象(因变量)所进行的数理统计分析处理。只有当自变量与因变量确实存在某种关系时,建立的回归方程才有意义。因此... 查看详情

相关分析总结

相关总结:在两个随机变量计算完相关系数之后,该系数还不能使用(只能说明两个变量呈何种相关关系,比如正相关或者负相关,x与y的变异有XX可由两者之间的线性关系来表示),        即不能... 查看详情

spss怎么进行列联分析

...这种分析就称为交叉列联表分析。当所观察的现象同时与两个因素有关时,如某种服装的销量受价格和居民收入的影响,某种产品的生产成本受原材料价格和产量的影响等,通过交叉列联表分析,可以较好地反映出这两个因素之... 查看详情

python实现pearson相关性检验(代码片段)

python实现pearson相关性检验两个变量之间的相关性可以采用Pearson或Spearman相关分析方法进行分析。Pearson相关分析主要用来分析正态分布、非等间距测度的连续变量,而Spearman可用来分析不服从双变量正态分布或总体分布型未知以... 查看详情

计量经济学多元线性回归分析中f检验和t检验的关系是啥意思

参考技术AF检验是对模型整体的检验t检验是对偏回归系数的检验本回答被提问者采纳 查看详情

r语言进行相关性分析

参考技术A相关性分析是指对两个或多个具备相关性的变量元素进行分析,从而衡量两个变量因素的相关密切程度。相关性分析旨在研究两个或两个以上随机变量之间相互依存关系的方向和密切程度。一般来讲研究对象(样品或... 查看详情

r-相关性分析

参考技术A相关性分析用于评估两个或多个变量之间的关联性。皮尔森相关性分析是一种参数相关性检验,检测的是两个变量间的线性关系;应用皮尔森相关性分析的前提是两个变量都是正态分布的,其相关性可以用线性回归曲... 查看详情

两个相关系数差异的显着性检验

】两个相关系数差异的显着性检验【英文标题】:Significancetestonthedifferenceoftwocorrelationcoefficient【发布时间】:2013-01-0906:02:18【问题描述】:如何测试两个相关系数是否显着不同-在GNUR中?也就是说,如果相同变量(例如年龄和收... 查看详情

python实现spearman相关性检验(代码片段)

...合含有等级变量或者全部是等级变量的相关性分析)测试两个样本是否具有单调关系。假设条件每个样本中的观察结果都是独立且均等分布的(iid)。可以对每个样本中的观察结果进行排名。解释 查看详情

方差协方差协方差矩阵

协方差(Covariance)在概率论和统计学中用于衡量两个变量的总体误差。而方差是协方差的一种特殊情况,即当两个变量是相同的情况。简单来讲,协方差就是衡量两个变量相关性的变量。当协方差为正时,两... 查看详情

关系检验

...检验  p值小于显著值,那么就是p显著,p越小代表两个样本的均值相差越大,否定原有假设则两个变量存在关系,p值越小关系越强  变异代表有差别  总变异为  组内变异  每个连续变量的取... 查看详情

在回归分析中,f检验和t检验各有啥作用

F检验是对整个模型而已的,看是不是自变量系数不全为0,而t检验则是分别针对某个自变量的,看每个自变量是否有显著预测效力。t检验的实质:主要用于样本含量较小(例如n<30),总体标准差σ未知的正态分布。[1] t检... 查看详情

数理统计学习统计假设检验

...数假设检验两大部分。当总体分布形式已知,检验的目的是对总体的参数及其性质作出判断,则称这种检验为参数假设检验。若总体分布形式未知,需对总体分布函数形式或总体之间的关系进行推断,则称为非参数假设检验。显... 查看详情

图同构的矩阵初等变换判定及算法设计

图同构问题图同构就是从顶点和边的拓扑图结构上来看,两个图是否有可能以同样的方式画出。从邻接矩阵角度来看,通过对其中一个邻接矩阵施加一系列的行和列的矩阵初等变换,能否使两者相等(即同构)或永远无法相等(即不同构... 查看详情

第7章直线相关与回归分析

第7章  直线相关与回归分析在生物学中,研究两个变量间的关系,主要是为了探求两变量的内在联系,或从一个变量X(可以是随机变量,也可以是一般的变量),去推测另一个随机变量Y。 (三)t检验第三节:直线相... 查看详情

相关性分析

  相关分析就是对总体中确实具有联系的标志进行分析,其主体是对总体中具有因果关系标志的分析。它是描述客观事物相互间关系的密切程度并用适当的统计指标表示出来的过程。在一段时期内出生率随经济水平上升而... 查看详情