主題
Search

正態分佈


NormalDistribution

變數 X 中,具有均值 mu方差 sigma^2 的正態分佈是一種統計分佈,其機率密度函式

 P(x)=1/(sigmasqrt(2pi))e^(-(x-mu)^2/(2sigma^2))
(1)

定義域為 x in (-infty,infty)。雖然統計學家和數學家統一使用術語“正態分佈”來指代這種分佈,但物理學家有時稱其為高斯分佈,並且由於其彎曲的喇叭形,社會科學家將其稱為“鐘形曲線”。Feller (1968) 使用符號 phi(x) 表示上述方程中的 P(x),但隨後在 Feller (1971) 中切換為 n(x)

棣莫弗開發了正態分佈作為二項分佈的近似,隨後拉普拉斯在 1783 年將其用於研究測量誤差,高斯在 1809 年將其用於天文資料分析(Havil 2003,第 157 頁)。

正態分佈在 Wolfram 語言中實現為NormalDistribution[mu, sigma]。

所謂的“標準正態分佈”是透過在一般正態分佈中取 mu=0sigma^2=1 給出的。任意正態分佈可以透過將變數更改為 Z=(X-mu)/sigma 轉換為標準正態分佈,因此 dz=dx/sigma,得到

 P(x)dx=1/(sqrt(2pi))e^(-z^2/2)dz.
(2)

費希爾-貝倫斯問題是確定檢驗兩個具有不同方差的正態分佈的均值是否相等的檢驗。

正態分佈函式 Phi(z) 給出了標準正態變數在區間 [0,z] 取值的機率,

Phi(z)=1/(sqrt(2pi))int_0^ze^(-x^2/2)dx
(3)
=1/2erf(z/(sqrt(2))),
(4)

其中 erf 是有時稱為誤差函式的函式。Phi(z)erf 都不能用有限的加法、減法、乘法和開方來表示,因此都必須進行數值計算或以其他方式近似。

NormalDistributionLimitOfBinomialDistribution

正態分佈是離散二項分佈 P_p(n|N)樣本量 N 變得很大時的極限情況,在這種情況下,P_p(n|N) 是正態分佈,均值方差

mu=Np
(5)
sigma^2=Npq,
(6)

其中 q=1-p

分佈 P(x) 是正確歸一化的,因為

 int_(-infty)^inftyP(x)dx=1.
(7)

累積分佈函式,它給出了變數將取值 <=x 的機率,是正態分佈的積分,

D(x)=int_(-infty)^xP(x^')dx^'
(8)
=1/(sigmasqrt(2pi))int_(-infty)^xe^(-(x^'-mu)^2/(2sigma^2))dx^'
(9)
=1/2[1+erf((x-mu)/(sigmasqrt(2)))],
(10)

其中 erf 是所謂的誤差函式。

正態分佈具有許多方便的特性,因此具有未知分佈的隨機變數通常被假定為正態分佈,尤其是在物理學和天文學中。儘管這可能是一個危險的假設,但由於一個稱為中心極限定理的驚人結果,它通常是一個很好的近似。該定理指出,任何具有有限均值方差的分佈的變數集合的均值都趨向於正態分佈。許多常見的屬性,如考試成績、身高等等,都大致遵循正態分佈,兩端成員很少,中間成員很多。

由於正態分佈如此頻繁地出現,因此不幸的是,人們傾向於在可能不適用的情況下呼叫正態分佈。正如李普曼所說,“每個人都相信誤差的指數定律:實驗者,因為他們認為可以用數學證明它;數學家,因為他們相信它已經透過觀察建立”(Whittaker 和 Robinson 1967,第 179 頁)。

正態分佈的驚人特性包括,分別透過對來自兩個具有任意均值和方差的獨立正態分佈的變數 XY 進行加法和減法獲得的正態和分佈正態差分佈也是正態分佈!從 X/Y 獲得的正態比分佈具有柯西分佈

使用k 統計量形式,正態分佈方差無偏估計量由下式給出

 sigma^2=N/(N-1)s^2,
(11)

其中

 s^2=1/Nsum_(i=1)^N(x_i-x^_)^2,
(12)

所以

 var(x^_)=(s^2)/(N-1).
(13)

正態分佈的特徵函式

 phi(t)=e^(imt-sigma^2t^2/2),
(14)

並且矩生成函式

M(t)=<e^(tx)>
(15)
=int_(-infty)^infty(e^(tx))/(sigmasqrt(2pi))e^(-(x-mu)^2/(2sigma^2))dx
(16)
=e^(mut+sigma^2t^2/2),
(17)

所以

M^'(t)=(mu+sigma^2t)e^(mut+sigma^2t^2/2)
(18)
M^('')(t)=sigma^2e^(mut+sigma^2t^2/2)+e^(mut+sigma^2t^2/2)(mu+tsigma^2)^2,
(19)

mu=M^'(0)=mu
(20)
sigma^2=M^('')(0)-[M^'(0)]^2=sigma^2.
(21)

這些也可以使用

R(t)=ln[M(t)]=mut+1/2sigma^2t^2
(22)
R^'(t)=mu+sigma^2t
(23)
R^('')(t)=sigma^2,
(24)

計算,和之前一樣,得到

mu=R^'(0)=mu
(25)
sigma^2=R^('')(0)=sigma^2.
(26)

原始矩也可以透過直接計算原始矩 mu_n^'=<x^n> 來計算,

 mu_n^'=1/(sigmasqrt(2pi))int_(-infty)^inftyx^ne^(-(x-mu)^2/(2sigma^2))dx.
(27)

(Papoulis 1984,第 147-148 頁)。現在令

u=(x-mu)/(sqrt(2)sigma)
(28)
du=(dx)/(sqrt(2)sigma)
(29)
x=sigmausqrt(2)+mu,
(30)

給出以高斯積分表示的原始矩,

 mu_n^'=1/(sqrt(pi))int_(-infty)^inftyx^ne^(-u^2)du.
(31)

評估這些積分得到

mu_0^'=1
(32)
mu_1^'=mu
(33)
mu_2^'=mu^2+sigma^2
(34)
mu_3^'=mu(mu^2+3sigma^2)
(35)
mu_4^'=mu^4+6mu^2sigma^2+3sigma^4.
(36)

現在找到中心矩

mu_1=0
(37)
mu_2=sigma^2
(38)
mu_3=0
(39)
mu_4=3sigma^4.
(40)

方差偏度超額峰度由下式給出

var(x)=sigma^2
(41)
gamma_1=0
(42)
gamma_2=0.
(43)

正態分佈的累積量生成函式

K(h)=ln(e^(nu_1h)e^(sigma^2h^2/2))
(44)
=nu_1h+1/2sigma^2h^2,
(45)

所以

kappa_1=nu_1
(46)
kappa_2=sigma^2
(47)
kappa_r=0  for r>2.
(48)

對於正態變數,當 r>2 時,kappa_r=0,因此 k 統計量 k_3 的方差為

var(k_3)=(kappa_6)/N+(9kappa_2kappa_4)/(N-1)+(9kappa_3^2)/(N-1)+(6kappa_2^3)/(N(N-1)(N-2))
(49)
=(6kappa_2^3)/(N(N-1)(N-2)).
(50)

此外,

var(k_4)=(24k_2^4N(N-1)^2)/((N-3)(N-2)(N+3)(N+5))
(51)
var(g_1)=(6N(N-1))/((N-2)(N+1)(N+3))
(52)
var(g_2)=(24N(N-1)^2)/((N-3)(N-2)(N+3)(N+5)),
(53)

其中

g_1=(k_3)/(k_2^(3/2))
(54)
g_2=(k_4)/(k_2^2).
(55)

一般分佈的樣本方差 s^2方差由下式給出

 var(s^2)=((N-1)[(N-1)mu_4-(N-3)mu_2^2])/(N^3),
(56)

在正態分佈的情況下簡化為

 var(s^2)=(2sigma^4(N-1))/(N^2)
(57)

(Kenney 和 Keeping 1951,第 164 頁)。

如果 P(x) 是正態分佈,則

 D(x)=1/2[1+erf((x-mu)/(sigmasqrt(2)))],
(58)

因此,具有正態分佈的變數 X_i 可以從在 (0,1) 中具有均勻分佈的變數 Y_i 透過下式生成

 X_i=sigmasqrt(2)erf^(-1)(2Y_i-1)+mu.
(59)

然而,獲得具有正態分佈的數字的更簡單方法是使用Box-Muller 變換

以正態分佈作為其解的微分方程是

 (dy)/(dx)=(y(mu-x))/(sigma^2),
(60)

因為

 (dy)/y=(mu-x)/(sigma^2)dx
(61)
 ln(y/(y_0))=-1/(2sigma^2)(mu-x)^2
(62)
 y=y_0e^(-(x-mu)^2/(2sigma^2)).
(63)

此方程已被推廣以產生更復雜的分佈,這些分佈使用所謂的皮爾遜系統命名。

正態分佈也是卡方分佈的一種特殊情況,因為進行替換

 1/2z=((x-mu)^2)/(2sigma^2)
(64)

得到

d(1/2z)=((x-mu))/(sigma^2)dx
(65)
=(sqrt(z))/sigmadx.
(66)

現在,實線 x in (-infty,infty) 透過此變換對映到半無限區間 z in [0,infty),因此必須向 d(z/2) 新增額外的因子 2,將 P(x)dx 轉換為

P(z)dz=1/(sigmasqrt(2pi))e^(-z/2)sigma/(sqrt(z))2(1/2dz)
(67)
=(e^(-z/2)z^(-1/2))/(2^(1/2)Gamma(1/2))dz
(68)

(Kenney 和 Keeping 1951,第 98 頁),其中使用了恆等式 Gamma(1/2)=sqrt(pi)。正如承諾的,(68) 是 z 中的卡方分佈r=1 (也是 alpha=1/2theta=2伽瑪分佈)。


另請參閱

二項分佈, 二元正態分佈, Box-Muller 變換, 中心極限定理, Erf, 誤差函式分佈, 費希爾-貝倫斯問題, 高爾頓板, 高斯函式, 半正態分佈, 逆高斯分佈, 柯爾莫哥洛夫-斯米爾諾夫檢驗, Logit 變換, 正態分佈函式, 正態乘積分佈, 正態比分佈, 正態和分佈, Owen T 函式, 皮爾遜系統, 比率分佈, 標準正態分佈, 四分相關函式, z 分數 在 課堂中探索此主題

使用 探索

參考文獻

Beyer, W. H. CRC 標準數學表,第 28 版。 Boca Raton, FL: CRC Press, pp. 533-534, 1987.Feller, W. 機率論及其應用導論,第 1 卷,第 3 版。 New York: Wiley, 1968.Feller, W. 機率論及其應用導論,第 2 卷,第 3 版。 New York: Wiley, p. 45, 1971.Havil, J. 伽瑪:探索尤拉常數。 Princeton, NJ: Princeton University Press, p. 157, 2003.Kenney, J. F. 和 Keeping, E. S. 統計數學,第 2 部分,第 2 版。 Princeton, NJ: Van Nostrand, 1951.Kraitchik, M. "誤差曲線。" §6.4 in 數學娛樂。 New York: W. W. Norton, pp. 121-123, 1942.Papoulis, A. 機率、隨機變數和隨機過程,第 2 版。 New York: McGraw-Hill, pp. 100-101, 1984.Patel, J. K. 和 Read, C. B. 正態分佈手冊。 New York: Dekker, 1982.Spiegel, M. R. 機率與統計理論與問題。 New York: McGraw-Hill, pp. 109-111, 1992.Steinhaus, H. 數學快照,第 3 版。 New York: Dover, pp. 285-290, 1999.Whittaker, E. T. 和 Robinson, G. "正態頻率分佈。" Ch. 8 in 觀測計算:數值數學專著,第 4 版。 New York: Dover, pp. 164-208, 1967.

在 上被引用

正態分佈

引用為

Weisstein, Eric W. “正態分佈。” 來自 Web 資源。 https://mathworld.tw/NormalDistribution.html

主題分類