主題
Search

方差


對於具有分佈 P(x)已知 總體均值 mu 的單個 變數 X總體方差 var(X),通常也寫作 sigma^2,定義為

 sigma^2=<(X-mu)^2>,
(1)

其中 mu總體均值,而 <X> 表示 X期望值。對於具有 N 個可能值 x_i離散分佈,總體方差因此為

 sigma^2=sum_(i=1)^NP(x_i)(x_i-mu)^2,
(2)

而對於 連續分佈,它由下式給出

 sigma^2=intP(x)(x-mu)^2dx.
(3)

因此,方差等於第二個 中心矩 mu_2

請注意,在將 sigma^2 解釋為方差時,需要謹慎,因為符號 sigma 也常被用作與方差的平方根相關但不等同的引數,例如在對數正態分佈麥克斯韋分佈瑞利分佈中。

如果基礎分佈未知,則可以計算樣本方差

 s_N^2=1/Nsum_(i=1)^N(x_i-x^_)^2,
(4)

其中 x^_樣本均值

請注意,上面定義的樣本方差 s_N^2 不是 總體方差 sigma^2無偏估計量。為了獲得 sigma^2 的無偏估計量,有必要改為定義“偏差校正樣本方差”

 s_(N-1)^2=1/(N-1)sum_(i=1)^N(x_i-x^_)^2.
(5)

s_N^2s_(N-1)^2 之間的區別是常見的混淆來源,在查閱文獻以確定使用哪種約定,特別是當不明確的符號 s 通常用於兩者時,應格外小心。資料列表的偏差校正樣本方差 s_(N-1)^2 實現為方差[列表]。

方差的平方根稱為標準差

s_N^2 給出總體方差有偏估計量的原因是,實際上是從資料本身估計了兩個自由引數 musigma^2。在這種情況下,使用 Student's t 分佈 而不是 正態分佈 作為模型是合適的,因為,非常籠統地說,Student's t 分佈是在不知道 sigma^2 的情況下可以做到的“最佳”選擇。

形式上,為了從先驗未知 均值(即均值是從樣本本身估計的)的 n 個元素的樣本中估計總體方差 sigma^2,我們需要 sigma^2無偏估計量。這由 k 統計量 k_2=sigma^^^2 給出,其中

 k_2=N/(N-1)m_2
(6)

m_2=s_N^2 是未針對偏差校正的樣本方差

事實證明,量 Ns_N^2/sigma^2 具有 卡方分佈

對於資料集 X,透過線性變換獲得的資料的方差由下式給出

var(aX+b)=<[(aX+b)-<aX+b>]^2>
(7)
=<(aX+b-a<X>-b)^2>
(8)
=<(aX-amu)^2>
(9)
=<a^2(X-mu)^2>
(10)
=a^2<(X-mu)^2>
(11)
=a^2var(X)
(12)

對於多個變數,方差使用協方差的定義給出,

var(sum_(i=1)^(n)X_i)=cov(sum_(i=1)^(n)X_i,sum_(j=1)^(n)X_j)
(13)
=sum_(i=1)^(n)sum_(j=1)^(n)cov(X_i,X_j)
(14)
=sum_(i=1)^(n)sum_(j=1; j=i)^(n)cov(X_i,X_j)+sum_(i=1)^(n)sum_(j=1; j!=i)^(n)cov(X_i,X_j)
(15)
=sum_(i=1)^(n)cov(X_i,X_i)+sum_(i=1)^(n)sum_(j=1; j!=i)^(n)cov(X_i,X_j)
(16)
=sum_(i=1)^(n)var(X_i)+2sum_(i=1)^(n)sum_(j=i+1)^(n)cov(X_i,X_j).
(17)

線性求和具有類似的形式

var(sum_(i=1)^(n)a_iX_i)=cov(sum_(i=1)^(n)a_iX_i,sum_(j=1)^(n)a_jX_j)
(18)
=sum_(i=1)^(n)sum_(j=1)^(n)a_ia_jcov(X_i,X_j)
(19)
=sum_(i=1)^(n)a_i^2var(X_i)+2sum_(i=1)^(n)sum_(j=i+1)^(n)a_ia_jcov(X_i,X_j).
(20)

這些方程可以使用協方差矩陣表示。


參見

中心矩, Charlier 校驗, 協方差, 協方差矩陣, 誤差傳播, k 統計量, 均值, , 原點矩, 樣本方差, 樣本方差計算, 樣本方差分佈, Sigma, 標準誤差, 統計相關性 在 課堂中探索此主題

使用 探索

參考文獻

Kenney, J. F. 和 Keeping, E. S. 統計數學,第 2 部分,第 2 版。 Princeton, NJ: Van Nostrand, 1951.Papoulis, A. 機率、隨機變數和隨機過程,第 2 版。 New York: McGraw-Hill, pp. 144-145, 1984.Press, W. H.; Flannery, B. P.; Teukolsky, S. A.; 和 Vetterling, W. T. "分佈的矩:均值、方差、偏度和等等。" §14.1 在 FORTRAN 數值食譜:科學計算的藝術,第 2 版。 Cambridge, England: Cambridge University Press, pp. 604-609, 1992.Roberts, M. J. 和 Riccardo, R. 方差分析學生指南。 London: Routledge, 1999.

在 上引用

方差

請引用為

Weisstein, Eric W. "方差。" 來自 Web 資源。 https://mathworld.tw/Variance.html

主題分類