在變數 中,具有均值
和方差
的正態分佈是一種統計分佈,其機率密度函式為
|
(1)
|
定義域為 。雖然統計學家和數學家統一使用術語“正態分佈”來指代這種分佈,但物理學家有時稱其為高斯分佈,並且由於其彎曲的喇叭形,社會科學家將其稱為“鐘形曲線”。Feller (1968) 使用符號
表示上述方程中的
,但隨後在 Feller (1971) 中切換為
。
棣莫弗開發了正態分佈作為二項分佈的近似,隨後拉普拉斯在 1783 年將其用於研究測量誤差,高斯在 1809 年將其用於天文資料分析(Havil 2003,第 157 頁)。
正態分佈在 Wolfram 語言中實現為NormalDistribution[mu, sigma]。
所謂的“標準正態分佈”是透過在一般正態分佈中取 和
給出的。任意正態分佈可以透過將變數更改為
轉換為標準正態分佈,因此
,得到
|
(2)
|
費希爾-貝倫斯問題是確定檢驗兩個具有不同方差的正態分佈的均值是否相等的檢驗。
正態分佈函式 給出了標準正態變數在區間
取值的機率,
|
(3)
| |||
|
(4)
|
其中 erf 是有時稱為誤差函式的函式。 和 erf 都不能用有限的加法、減法、乘法和開方來表示,因此都必須進行數值計算或以其他方式近似。
正態分佈是離散二項分佈 在樣本量
變得很大時的極限情況,在這種情況下,
是正態分佈,均值和方差為
|
(5)
| |||
|
(6)
|
其中 。
分佈 是正確歸一化的,因為
|
(7)
|
累積分佈函式,它給出了變數將取值 的機率,是正態分佈的積分,
|
(8)
| |||
|
(9)
| |||
|
(10)
|
其中 erf 是所謂的誤差函式。
正態分佈具有許多方便的特性,因此具有未知分佈的隨機變數通常被假定為正態分佈,尤其是在物理學和天文學中。儘管這可能是一個危險的假設,但由於一個稱為中心極限定理的驚人結果,它通常是一個很好的近似。該定理指出,任何具有有限均值和方差的分佈的變數集合的均值都趨向於正態分佈。許多常見的屬性,如考試成績、身高等等,都大致遵循正態分佈,兩端成員很少,中間成員很多。
由於正態分佈如此頻繁地出現,因此不幸的是,人們傾向於在可能不適用的情況下呼叫正態分佈。正如李普曼所說,“每個人都相信誤差的指數定律:實驗者,因為他們認為可以用數學證明它;數學家,因為他們相信它已經透過觀察建立”(Whittaker 和 Robinson 1967,第 179 頁)。
正態分佈的驚人特性包括,分別透過對來自兩個具有任意均值和方差的獨立正態分佈的變數 和
進行加法和減法獲得的正態和分佈和正態差分佈也是正態分佈!從
獲得的正態比分佈具有柯西分佈。
|
(11)
|
其中
|
(12)
|
所以
|
(13)
|
正態分佈的特徵函式為
|
(14)
|
並且矩生成函式為
|
(15)
| |||
|
(16)
| |||
|
(17)
|
所以
|
(18)
| |||
|
(19)
|
和
|
(20)
| |||
|
(21)
|
這些也可以使用
|
(22)
| |||
|
(23)
| |||
|
(24)
|
計算,和之前一樣,得到
|
(25)
| |||
|
(26)
|
原始矩也可以透過直接計算原始矩 來計算,
|
(27)
|
(Papoulis 1984,第 147-148 頁)。現在令
|
(28)
| |||
|
(29)
| |||
|
(30)
|
給出以高斯積分表示的原始矩,
|
(31)
|
評估這些積分得到
|
(32)
| |||
|
(33)
| |||
|
(34)
| |||
|
(35)
| |||
|
(36)
|
現在找到中心矩,
|
(37)
| |||
|
(38)
| |||
|
(39)
| |||
|
(40)
|
|
(41)
| |||
|
(42)
| |||
|
(43)
|
正態分佈的累積量生成函式為
|
(44)
| |||
|
(45)
|
所以
|
(46)
| |||
|
(47)
| |||
|
(48)
|
對於正態變數,當 時,
,因此 k 統計量
的方差為
|
(49)
| |||
|
(50)
|
此外,
|
(51)
| |||
|
(52)
| |||
|
(53)
|
其中
|
(54)
| |||
|
(55)
|
|
(56)
|
在正態分佈的情況下簡化為
|
(57)
|
(Kenney 和 Keeping 1951,第 164 頁)。
如果 是正態分佈,則
|
(58)
|
因此,具有正態分佈的變數 可以從在 (0,1) 中具有均勻分佈的變數
透過下式生成
|
(59)
|
然而,獲得具有正態分佈的數字的更簡單方法是使用Box-Muller 變換。
以正態分佈作為其解的微分方程是
|
(60)
|
因為
|
(61)
|
|
(62)
|
|
(63)
|
此方程已被推廣以產生更復雜的分佈,這些分佈使用所謂的皮爾遜系統命名。
正態分佈也是卡方分佈的一種特殊情況,因為進行替換
|
(64)
|
得到
|
(65)
| |||
|
(66)
|
現在,實線 透過此變換對映到半無限區間
,因此必須向
新增額外的因子 2,將
轉換為
|
(67)
| |||
|
(68)
|
(Kenney 和 Keeping 1951,第 98 頁),其中使用了恆等式 。正如承諾的,(68) 是
中的卡方分佈,
(也是
和
的伽瑪分佈)。