列聯表,有時也稱為雙向頻率表,是一種表格機制,至少有兩行和兩列,在統計學中用於以頻數計數的形式呈現分類資料。更準確地說,一個 列聯表顯示了兩個變數的觀測頻率,這些觀測頻率被排列成
行和
列。列聯表的行和列的交叉點稱為單元格。
| 性別 | 杯子 | 蛋筒 | 聖代 | 三明治 | 其他 |
| 男性 | 592 | 300 | 204 | 24 | 80 |
| 女性 | 410 | 335 | 180 | 20 | 55 |
例如,上面的列聯表有兩行五列(不包括標題行/列),顯示了根據兩個變數(即性別和最喜歡的冰淇淋食用方式 (Larson and Farber 2014))對 名成年人進行隨機抽樣的結果。以列聯表形式呈現資料的一個好處是,它可以更輕鬆地執行基本的機率計算,透過在表格中新增彙總行和列,這項工作變得更加容易。
| 性別 | 杯子 | 蛋筒 | 聖代 | 三明治 | 其他 | 總計 |
| 男性 | 592 | 300 | 204 | 24 | 80 | 1200 |
| 女性 | 410 | 335 | 180 | 20 | 55 | 1000 |
| 總計 | 1002 | 635 | 384 | 44 | 135 | 2200 |
上表是透過新增彙總行和列獲得的第一個表的擴充套件版本。這些彙總使得更容易計算幾個不同的機率相關量。例如,被抽樣的人喜歡用杯子吃冰淇淋的機率約為 ,即 45.54%,而隨機參與者是女性的機率約為
,即 45.45%。更重要的是,使用列聯表可以更輕鬆地計算條件機率,例如,在已知該人為男性的情況下,某人喜歡冰淇淋三明治的機率為
,即 2%,而在已知偏好冰淇淋三明治的情況下,某人為男性的條件機率為
,約為 54.54%。
其他常見的統計分析可以在以列聯表形式給出的資料上執行。例如,一個有用的已知值是列 和行
交匯處的單元格的所謂期望頻率
,其公式為:
|
(1)
|
計算 表示在單元格
處期望的值——即,喜歡用杯子吃冰淇淋的男性人數的期望值——大約是:
|
(2)
|
由此可以推斷出,在給定的樣本中,該特定人群的“多於預期”。另請注意,知道 會自動給出,例如
,而無需重複應用 ()
|
(3)
|
計算期望頻率的主要好處之一是能夠檢驗所檢查的兩個變數(在本例中為性別和最喜歡的冰淇淋食用方式)是否像之前假設的那樣實際上是獨立的。這是透過計算每個單元格 的期望頻率
,將其與觀測頻率
進行比較,然後執行卡方檢驗來完成的。
與列聯表相關的另一個常見檢驗是所謂的比例同質性檢驗,它是卡方檢驗的一種形式,用於確定當從不同人群中抽取樣本時,幾個比例是否相等 (Larson and Farber 2014)。值得注意的是,上述卡方檢驗的兩個例項都需要對觀測頻率進行隨機抽樣,且每個觀測頻率的期望頻率至少為 5。這些檢驗在統計學的各個分支中都起著重要作用。