主題
Search

統計相關性


對於兩個隨機變數 XY,相關性定義為

 cor(X,Y)=(cov(X,Y))/(sigma_Xsigma_Y),
(1)

其中 sigma_X 表示標準差cov(X,Y) 是這兩個變數的協方差。對於變數 X_iX_j 的一般情況,其中 i,j=1, 2, ..., n,

 cor(X_i,X_j)=(cov(X_i,X_j))/(sqrt(V_(ii)V_(jj))),
(2)

其中 V_(ii)協方差矩陣的元素。一般來說,相關性表示變數之間關係的強度。對於 i=j,

 cor(X_i,X_i)=(cov(X_i,X_i))/(sigma_i^2)=1.
(3)

根據定義,任何量的方差始終是非負的,因此

 var(X/(sigma_X)+Y/(sigma_Y))>=0.
(4)

根據方差的性質,總和可以展開

 var(X/(sigma_X))+var(Y/(sigma_Y))+2cov(X/(sigma_X),Y/(sigma_Y))>=0
(5)
 1/(sigma_X^2)var(X)+1/(sigma_Y^2)var(Y)+2/(sigma_Xsigma_Y)cov(X,Y)>=0
(6)
 1+1+2/(sigma_Xsigma_Y)cov(X,Y)=2+2/(sigma_Xsigma_Y)cov(X,Y)>=0.
(7)

因此,

 cor(X,Y)=(cov(X,Y))/(sigma_Xsigma_Y)>=-1.
(8)

類似地,

 var(X/(sigma_X)-Y/(sigma_Y))>=0
(9)
 var(X/(sigma_X))+var(-Y/(sigma_Y))+2cov(X/(sigma_X),-Y/(sigma_Y))>=0
(10)
 1/(sigma_X^2)var(X)+1/(sigma_Y^2)var(Y)-2/(sigma_Xsigma_Y)cov(X,Y)>=0
(11)
 1+1-2/(sigma_Xsigma_Y)cov(X,Y)=2-2/(sigma_Xsigma_Y)cov(X,Y)>=0.
(12)

因此,

 cor(X,Y)=(cov(X,Y))/(sigma_Xsigma_Y)<=1,
(13)

所以 -1<=cor(X,Y)<=1

對於兩個變數的線性組合

var(Y-bX)=var(Y)+var(-bX)+2cov(Y,-bX)
(14)
=var(Y)+b^2var(X)-2bcov(X,Y)
(15)
=sigma_Y^2+b^2sigma_X^2-2bcov(X,Y)
(16)
=sigma_Y^2+b^2sigma_X^2-2bsigma_Xsigma_Ycor(X,Y).
(17)

考察 cor(X,Y)=+/-1 的情況,

 cor(X,Y)=(cov(X,Y))/(sigma_Xsigma_Y)=+/-1
(18)
 var(Y-bX)=b^2sigma_X^2+sigma_Y^2∓2bsigma_Xsigma_Y=(bsigma_X∓sigma_Y)^2.
(19)

如果 b=+/-sigma_Y/sigma_X方差將為零,這要求 方差的引數是一個常數。因此,y-bx=a,所以 y=a+bx。如果 cor(X,Y)=+/-1,則 yx 完全正相關 (b>0) 或完全負相關 (b<0)。


另請參閱

協方差, 協方差矩陣, 方差

使用 探索

請引用為

Weisstein, Eric W. “統計相關性。” 來自 —— 資源。https://mathworld.tw/StatisticalCorrelation.html

主題分類