主題
Search

協方差


協方差提供了衡量兩個或多個隨機變數集之間相關性強度的指標。對於兩個隨機變數 XY,每個變數的樣本大小N,協方差由期望值定義

cov(X,Y)=<(X-mu_X)(Y-mu_Y)>
(1)
=<XY>-mu_Xmu_y
(2)

其中 mu_x=<X>mu_y=<Y> 分別是 均值,可以顯式地寫成

 cov(X,Y)=sum_(i=1)^N((x_i-x^_)(y_i-y^_))/N.
(3)

對於不相關的變數,

 cov(X,Y)=<XY>-mu_Xmu_Y=<X><Y>-mu_Xmu_Y=0,
(4)

因此,協方差為零。然而,如果變數在某種程度上是相關的,那麼它們的協方差將是非零的。事實上,如果 cov(X,Y)>0,那麼當 X 增加時,Y 趨於增加;如果 cov(X,Y)<0,那麼當 X 增加時,Y 趨於減小。請注意,雖然統計上獨立的變數總是互不相關的,但反之不一定成立。

Y=X 的特殊情況下,

cov(X,X)=<X^2>-<X>^2
(5)
=sigma_X^2,
(6)

因此,協方差簡化為通常的方差 sigma_X^2=var(X)。這促使我們使用符號 sigma_(XY)=cov(X,Y),這提供了一種一致的方式來表示方差sigma_(XX)=sigma_X^2,其中 sigma_X標準差

匯出的量

cor(X,Y)=(cov(X,Y))/(sigma_Xsigma_Y)
(7)
=(sigma_(XY))/(sqrt(sigma_(XX)sigma_(YY))),
(8)

被稱為 統計相關性,用於衡量 XY

當檢視兩個隨機變數之和的方差時,協方差尤其有用,因為

 var(X+Y)=var(X)+var(Y)+2cov(X,Y).
(9)

根據定義,協方差是對稱的,因為

 cov(X,Y)=cov(Y,X).
(10)

給定 n 個隨機變數,表示為 X_1, ..., X_nX_iX_j 的協方差 sigma_(ij)=cov(X_i,X_j) 定義為

cov(X_i,X_j)=<(X_i-mu_i)(X_j-mu_j)>
(11)
=<X_iX_j>-mu_imu_j,
(12)

其中 mu_i=<X_i>mu_j=<X_j> 分別是 X_iX_j均值。量 V_(ij)=cov(X_i,X_j) 的矩陣 (V_(ij)) 稱為協方差矩陣

協方差服從以下恆等式

cov(X+Z,Y)=<(X+Z)Y>-<X+Z><Y>
(13)
=<XY>+<ZY>-(<X>+<Z>)<Y>
(14)
=<XY>-<X><Y>+<ZY>-<Z><Y>
(15)
=cov(X,Y)+cov(Z,Y).
(16)

透過歸納,因此得出

cov(sum_(i=1)^(n)X_i,Y)=sum_(i=1)^(n)cov(X_i,Y)
(17)
cov(sum_(i=1)^(n)X_i,sum_(j=1)^(m)Y_j)=sum_(i=1)^(n)cov(X_i,sum_(j=1)^(m)Y_j)
(18)
=sum_(i=1)^(n)cov(sum_(j=1)^(m)Y_j,X_i)
(19)
=sum_(i=1)^(n)sum_(j=1)^(m)cov(Y_j,X_i)
(20)
=sum_(i=1)^(n)sum_(j=1)^(m)cov(X_i,Y_j).
(21)

另請參閱

二元正態分佈, 相關係數, 協方差矩陣, 統計相關性, 方差 在 課堂中探索此主題

使用 探索

參考文獻

Snedecor, G. W. 和 Cochran, W. G. 統計方法,第 7 版。 Ames, IA: Iowa State Press, p. 180, 1980。Spiegel, M. R. 機率與統計的理論和問題,第 2 版。 New York: McGraw-Hill, p. 298, 1992。

在 中被引用

協方差

請引用為

Weisstein, Eric W. “協方差。” 來自 —— 資源。 https://mathworld.tw/Covariance.html

主題分類