威廉·戈塞特於 1908 年發表的一種統計分佈。他的僱主吉尼斯啤酒廠要求他使用筆名發表,因此他選擇了“Student”。 給定 個獨立測量值
,令
|
(1)
|
其中 是總體均值,
是樣本均值,s 是總體標準差(即樣本方差)的估計量,定義為
|
(2)
|
學生 -分佈定義為隨機變數
的分佈,它(非常粗略地)是在不知道
的情況下我們能做的“最好”的。
具有 個自由度的學生
分佈在 Wolfram 語言中實現為StudentTDistribution[n].
如果 ,
並且分佈變為正態分佈。 隨著
的增加,學生
-分佈接近正態分佈。
學生 -分佈可以透過使用以下公式轉換 Student's z-分佈來匯出
|
(3)
|
然後定義
|
(4)
|
得到的機率和累積分佈函式是
|
(5)
| |||
|
(6)
| |||
|
(7)
| |||
|
(8)
| |||
|
(9)
|
其中
|
(10)
|
是自由度數,,
是伽瑪函式,
是貝塔函式,
是超幾何函式,I(z;a,b) 是由下式定義的正則化貝塔函式
|
(11)
|
|
(12)
| |||
|
(13)
| |||
|
(14)
| |||
|
(15)
|
前幾個 值的特徵函式
是
|
(16)
| |||
|
(17)
| |||
|
(18)
| |||
|
(19)
| |||
|
(20)
|
等等,其中 是第二類修正貝塞爾函式。
下表給出了置信區間,即 的值,使得分佈函式 分佈函式
等於各種機率,對於自由度數
的各種小值。 Beyer(1987 年,第 571 頁)給出了 60%、70%、90%、95%、97.5%、99%、99.5% 和 99.95% 的置信區間,Goulden(1956 年)給出了 50%、90%、95%、98%、99% 和 99.9% 的置信區間。
| 90% | 95% | 97.5% | 99.5% | |
| 1 | 3.07768 | 6.31375 | 12.7062 | 63.6567 |
| 2 | 1.88562 | 2.91999 | 4.30265 | 9.92484 |
| 3 | 1.63774 | 2.35336 | 3.18245 | 5.84091 |
| 4 | 1.53321 | 2.13185 | 2.77645 | 4.60409 |
| 5 | 1.47588 | 2.01505 | 2.57058 | 4.03214 |
| 10 | 1.37218 | 1.81246 | 2.22814 | 3.16927 |
| 30 | 1.31042 | 1.69726 | 2.04227 | 2.75000 |
| 100 | 1.29007 | 1.66023 | 1.98397 | 2.62589 |
| 1.28156 | 1.64487 | 1.95999 | 2.57588 |
具有相關矩陣 和
個自由度的學生
分佈的多元形式實現為MultivariateTDistribution[r, m] 在 Wolfram 語言包中MultivariateStatistics` .
所謂的 分佈對於測試兩個觀察到的分佈是否具有相同的均值很有用。
給出了對於具有
個自由度的某個統計量
,兩個觀察到的均值之差純粹是偶然機會小於觀察值的機率
|
(21)
|
令 為均值為 0 且方差為 正態分佈的隨機變數,令 均值
,令
具有自由度為 卡方分佈
,並令 自由度
和
獨立。 然後
|
(22)
|
分佈為自由度為 的學生
分佈。