異常值是落在分佈的總體模式之外的觀測值 (Moore 和 McCabe 1999)。通常,異常值的存在表明某種問題。這可能是不符合研究模型的案例,或者是測量中的錯誤。
異常值通常很容易在直方圖中被發現。例如,上圖中最左邊的點就是一個異常值。
異常值的一個方便的定義是,一個點落在第三四分位數之上或第一四分位數之下超過 1.5 倍的四分位距。
當比較兩組資料之間的關係時,也可能出現異常值。這種型別的異常值可以很容易地在散點圖上識別出來。
當對資料執行最小二乘擬合時,通常最好在計算最佳擬合線之前丟棄異常值。對於沿 方向的異常值尤其如此,因為這些點可能會極大地影響結果。