主題
Search

樣本方差分佈


N 個樣本取自具有 中心矩 mu_n 的總體。則 樣本方差 m_2 由下式給出

 m_2=1/Nsum_(i=1)^N(x_i-m)^2,
(1)

其中 m=x^_樣本均值

樣本大小為 Nm_2 的期望值由下式給出

 <s^2>=<m_2>=(N-1)/Nmu_2.
(2)

類似地,樣本方差的期望方差由下式給出

<var(s^2)>=<var(m_2)>
(3)
=((N-1)^2)/(N^3)mu_4-((N-1)(N-3)mu_2^2)/(N^3)
(4)

(Kenney 和 Keeping 1951,第 164 頁;Rose 和 Smith 2002,第 264 頁)。

手動推導方程 (4) 的代數運算相當繁瑣,但可以按如下步驟進行。首先注意到

 var(x)=<x^2>-<x>^2,
(5)

因此

 var(s^2)=<s^4>-<s^2>^2.
(6)

<s^2> 的值已從方程 (◇) 中得知,因此僅需找到 <s^4>。透過立即將變數轉換為 x_i^'=x_i-mu 並針對這些中心變數執行計算,代數運算將大大簡化。由於方差不依賴於基礎分佈的均值 mu,因此使用變換後的變數獲得的結果將給出相同的結果,同時立即消除包含 x_i 奇次冪的項之和的期望值(等於 0)。為了確定 <s^4>,展開方程 (6) 得到

<s^4>=<(s^2)^2>
(7)
=<(<x^2>-<x>^2)^2>
(8)
=<[1/Nsumx_i^2-(1/Nsumx_i)^2]^2>
(9)
=1/(N^2)<(sumx_i^2)^2>-2/(N^3)<sumx_i^2(sumx_i)^2>+1/(N^4)<(sumx_i)^4>.
(10)

處理 (10) 的第一項,

<(sumx_i^2)^2>=<sumx_i^4+sum_(i!=j)x_i^2x_j^2>
(11)
=<sumx_i^4>+<sum_(i!=j)x_i^2x_j^2>
(12)
=N<x_i^4>+N(N-1)<x_i^2><x_j^2>
(13)
=Nmu_4+N(N-1)mu_2^2.
(14)

(◇) 的第二項由下式給出

<sumx_i^2(sumx_j)^2>=<sumx_i^4+sum_(i!=j)x_i^2x_j^2+2sum_(i!=j)x_i^3x_j+sum_(i!=j!=k)x_i^2x_jx_k>
(15)
=Nmu_4+N(N-1)mu_2^2,
(16)

第三項由下式給出

<(sumx_i)^4>=<sumx_i^4+3sum_(i!=j)x_i^2x_j^2+4sum_(i!=j)x_i^3x_j+6sum_(i!=j!=k)x_i^2x_jx_k+sum_(i!=j!=k!=l)x_ix_jx_kx_l>
(17)
=<sumx_i^4>+3<sum_(i!=j)x_i^2x_j^2>
(18)
=Nmu_4+3N(N-1)mu_2^2.
(19)

將 (◇)-(19) 代入 (◇) 得到

<s^4>=1/(N^2)[Nmu_4+N(N-1)mu_2^2]-2/(N^3)[Nmu_4+N(N-1)mu_2^2]+1/(N^4)[Nmu_4+3N(N-1)mu_2^2]
(20)
=(1/N-2/(N^2)+1/(N^3))mu_4+[(N-1)/N-(2(N-1))/(N^2)+(3(N-1))/(N^3)]mu_2^2
(21)
=((N^2-2N+1)/(N^3))mu_4+((N-1)(N^2-2N+3))/(N^3)mu_2^2
(22)
=((N-1)[(N-1)mu_4+(N^2-2N+3)mu_2^2])/(N^3)
(23)

(Kenney 和 Keeping 1951,第 164 頁)。將 (◇) 和 (23) 代入 (◇) 得到

var(s^2)=<s^4>-<s^2>^2
(24)
=((N-1)[(N-1)mu_4-(N-3)mu_2^2])/(N^3),
(25)

如前所述。

SampleVarianceDistribution

對於正態分佈mu_2=sigma^2mu_4=3sigma^4,因此

m_1(s_(Gaussian)^2)=((N-1)sigma^2)/N
(26)
m_2(s_(Gaussian)^2)=(2(N-1)sigma^4)/(N^2).
(27)

s_(Gaussian)^2 的三階矩和四階矩由下式給出

m_3(s_(Gaussian)^2)=(8(N-1)sigma^6)/(N^3)
(28)
m_4(s_(Gaussian)^2)=(12(N-1)(N+3)sigma^8)/(N^4),
(29)

給出 s_(Gaussian)^2 分佈的偏度峰度超額

gamma_1(s_(Gaussian)^2)=sqrt(8/(N-1))
(30)
gamma_2(s_(Gaussian)^2)=(12)/(N-1),
(31)

正如 Student 計算的那樣。Student 還推測基礎分佈是 Pearson III 型分佈

 f(s^2)=((N/(2sigma^2))^((N-1)/2))/(Gamma((N-1)/2))(s^2)^((N-3)/2)e^(-Ns^2/(2sigma^2)),
(32)

其中 Gamma(z)伽瑪函式——R. A. Fisher 隨後證明了這一猜想。上面說明了 sigma=1NN=1 到 10 變化的曲線。


另請參閱

均值分佈, 樣本, 樣本方差, 樣本方差計算, 標準差分佈, 方差

使用 探索

參考資料

Kenney, J. F. 和 Keeping, E. S. 統計數學,第 2 部分,第 2 版。 普林斯頓,新澤西州:Van Nostrand,1951 年。Rose, C. 和 Smith, M. D. Mathematica 數理統計。 紐約:施普林格出版社,2002 年。

在 上被引用

樣本方差分佈

引用為

Weisstein, Eric W. "樣本方差分佈。" 來自 Web 資源。 https://mathworld.tw/SampleVarianceDistribution.html

主題分類