主題
Search

列聯表


列聯表,有時也稱為雙向頻率表,是一種表格機制,至少有兩行和兩列,在統計學中用於以頻數計數的形式呈現分類資料。更準確地說,一個 r×c 列聯表顯示了兩個變數的觀測頻率,這些觀測頻率被排列成 r 行和 c 列。列聯表的行和列的交叉點稱為單元格。

性別杯子蛋筒聖代三明治其他
男性5923002042480
女性4103351802055

例如,上面的列聯表有兩行五列(不包括標題行/列),顯示了根據兩個變數(即性別和最喜歡的冰淇淋食用方式 (Larson and Farber 2014))對 2200 名成年人進行隨機抽樣的結果。以列聯表形式呈現資料的一個好處是,它可以更輕鬆地執行基本的機率計算,透過在表格中新增彙總行和列,這項工作變得更加容易。

性別杯子蛋筒聖代三明治其他總計
男性59230020424801200
女性41033518020551000
總計1002635384441352200

上表是透過新增彙總行和列獲得的第一個表的擴充套件版本。這些彙總使得更容易計算幾個不同的機率相關量。例如,被抽樣的人喜歡用杯子吃冰淇淋的機率約為 1002/2200 approx 45.54%,即 45.54%,而隨機參與者是女性的機率約為 1000/2200 approx 45.45%,即 45.45%。更重要的是,使用列聯表可以更輕鬆地計算條件機率,例如,在已知該人為男性的情況下,某人喜歡冰淇淋三明治的機率為 24/1200=2%,即 2%,而在已知偏好冰淇淋三明治的情況下,某人為男性的條件機率為 24/44 approx 54.54%,約為 54.54%。

其他常見的統計分析可以在以列聯表形式給出的資料上執行。例如,一個有用的已知值是列 c 和行 r 交匯處的單元格的所謂期望頻率 E_(c,r),其公式為:

 E_(c,r)=((sum of row r)·(sum of columnc))/(sample size).
(1)

計算 E_(1,1) 表示在單元格 (1,1) 處期望的值——即,喜歡用杯子吃冰淇淋的男性人數的期望值——大約是:

 E_(1,1)=(1200·1002)/(2200) approx 546.54,
(2)

由此可以推斷出,在給定的樣本中,該特定人群的“多於預期”。另請注意,知道 E_(1,1) 會自動給出,例如 E_(2,1),而無需重複應用 ()

 E_(2,1)=(total people who prefer cups)-E_(1,1) approx 1002-546.54=455.46.
(3)

計算期望頻率的主要好處之一是能夠檢驗所檢查的兩個變數(在本例中為性別和最喜歡的冰淇淋食用方式)是否像之前假設的那樣實際上是獨立的。這是透過計算每個單元格 (c,r) 的期望頻率 E=E_(c,r),將其與觀測頻率 O=O_(c,r) 進行比較,然後執行卡方檢驗來完成的。

與列聯表相關的另一個常見檢驗是所謂的比例同質性檢驗,它是卡方檢驗的一種形式,用於確定當從不同人群中抽取樣本時,幾個比例是否相等 (Larson and Farber 2014)。值得注意的是,上述卡方檢驗的兩個例項都需要對觀測頻率進行隨機抽樣,且每個觀測頻率的期望頻率至少為 5。這些檢驗在統計學的各個分支中都起著重要作用。


另請參閱

分類變數, 卡方檢驗, 條件機率, 頻率分佈, 獨立事件, 機率, 樣本, 統計學, 變數

此條目由 Christopher Stover 貢獻

使用 探索

參考文獻

Larson, R. 和 Farber, B. 基礎統計學:世界的圖景,第 6 版。印第安納波利斯:培生高等教育出版社,2014 年。Triola, M. F. 基礎統計學,第 11 版。波士頓:艾迪生-韋斯利出版社,2011 年。

引用為

Stover, Christopher. “列聯表。” 來自 —— 資源,由 Eric W. Weisstein 建立。 https://mathworld.tw/ContingencyTable.html

主題分類