主題
Search

費希爾精確檢驗


費希爾精確檢驗是一種統計檢驗,用於確定兩個分類變數之間是否存在非隨機關聯。

假設存在兩個這樣的變數 XY,分別具有 mn 個觀測狀態。現在形成一個 m×n 矩陣,其中條目 a_(ij) 表示 x=iy=j 的觀測次數。計算行和列總和 R_iC_j,以及總和

 N=sum_(i)R_i=sum_(j)C_j
(1)

矩陣的總和。然後計算在給定特定行和列總和的情況下,獲得實際矩陣的條件機率,由下式給出

 P_(cutoff)=((R_1!R_2!...R_m!)(C_1!C_2!...C_n!))/(N!product_(i,j)a_(ij)!),
(2)

這是一個超幾何機率函式的多變數推廣。現在找到所有可能的矩陣,其元素為與行和列總和 R_iC_j 一致的非負整數。對於每一個矩陣,使用 (2) 計算相關的條件機率,其中這些機率的總和必須為 1。

為了計算檢驗的 P 值,表格必須首先按照某種衡量依賴性的標準進行排序,然後將那些表示與觀察到的表格相比,具有相等或更大程度偏離獨立性的表格的機率相加。有多種標準可以用來衡量依賴性。在 2×2 的情況下,這是費希爾在開發精確檢驗時所關注的情況,通常使用 Pearson 卡方檢驗或比例差異(兩者是等價的)。其他關聯性度量,例如似然比檢驗、G 平方,或通常用於列聯表關聯性的任何其他度量也可以使用。

該檢驗最常應用於 2×2 矩陣,並且對於較大的 mn 來說,計算上很笨拙。對於大於 2×2 的表格,比例差異不再適用,但上面提到的其他度量仍然適用(並且在實踐中,Pearson 統計量最常用於對錶格進行排序)。在 2×2 矩陣的情況下,檢驗的 P 值可以透過對所有 P 值求和來簡單計算,這些 P 值 <=P_(cutoff)

對於 2×2 檢驗的示例應用,假設 X 是一本期刊,例如《數學雜誌》或《科學》,Y 是在其中一本期刊的給定期號中,關於數學和生物學主題的文章數量。如果《數學雜誌》有五篇關於數學的文章和一篇關於生物學的文章,《科學》沒有關於數學的文章,有四篇關於生物學的文章,那麼相關的矩陣將是

  Math. Mag. Science ; math  5 0 R_1=5; biology  1 4 R_2=5;  C_1=6 C_2=4 N=10.
(3)

計算 P_(cutoff) 得到

 P_(cutoff)=(5!^26!4!)/(10!(5!0!1!4!))=0.0238,
(4)

以及其他可能的矩陣及其 P 值是

[4 1; 2 3]  P=0.2381
(5)
[3 2; 3 2]  P=0.4762
(6)
[2 3; 4 1]  P=0.2381
(7)
[1 4; 5 0]  P=0.0238,
(8)

正如要求的那樣,它們確實加起來為 1。小於或等於 P_(cutoff)=0.0238 的 P 值之和為 0.0476,因為它小於 0.05,所以是顯著的。因此,在這種情況下,期刊和出現的文章型別之間存在統計學上的顯著關聯。


使用 探索

請引用為

Weisstein, Eric W. "費希爾精確檢驗。" 來自 網路資源。 https://mathworld.tw/FishersExactTest.html

主題分類