費希爾精確檢驗是一種統計檢驗,用於確定兩個分類變數之間是否存在非隨機關聯。
假設存在兩個這樣的變數 和
,分別具有
和
個觀測狀態。現在形成一個
矩陣,其中條目
表示
和
的觀測次數。計算行和列總和
和
,以及總和
|
(1)
|
矩陣的總和。然後計算在給定特定行和列總和的情況下,獲得實際矩陣的條件機率,由下式給出
|
(2)
|
這是一個超幾何機率函式的多變數推廣。現在找到所有可能的矩陣,其元素為與行和列總和 和
一致的非負整數。對於每一個矩陣,使用 (2) 計算相關的條件機率,其中這些機率的總和必須為 1。
為了計算檢驗的 P 值,表格必須首先按照某種衡量依賴性的標準進行排序,然後將那些表示與觀察到的表格相比,具有相等或更大程度偏離獨立性的表格的機率相加。有多種標準可以用來衡量依賴性。在 的情況下,這是費希爾在開發精確檢驗時所關注的情況,通常使用 Pearson 卡方檢驗或比例差異(兩者是等價的)。其他關聯性度量,例如似然比檢驗、
平方,或通常用於列聯表關聯性的任何其他度量也可以使用。
該檢驗最常應用於 矩陣,並且對於較大的
或
來說,計算上很笨拙。對於大於
的表格,比例差異不再適用,但上面提到的其他度量仍然適用(並且在實踐中,Pearson 統計量最常用於對錶格進行排序)。在
矩陣的情況下,檢驗的 P 值可以透過對所有
值求和來簡單計算,這些 P 值
。
對於 檢驗的示例應用,假設
是一本期刊,例如《數學雜誌》或《科學》,Y 是在其中一本期刊的給定期號中,關於數學和生物學主題的文章數量。如果《數學雜誌》有五篇關於數學的文章和一篇關於生物學的文章,《科學》沒有關於數學的文章,有四篇關於生物學的文章,那麼相關的矩陣將是
|
(3)
|
計算 得到
|
(4)
|
以及其他可能的矩陣及其 P 值是
|
(5)
| |||
|
(6)
| |||
|
(7)
| |||
|
(8)
|
正如要求的那樣,它們確實加起來為 1。小於或等於 的 P 值之和為 0.0476,因為它小於 0.05,所以是顯著的。因此,在這種情況下,期刊和出現的文章型別之間存在統計學上的顯著關聯。