主題
Search

異常值


異常值是落在分佈的總體模式之外的觀測值 (Moore 和 McCabe 1999)。通常,異常值的存在表明某種問題。這可能是不符合研究模型的案例,或者是測量中的錯誤。

OutlierHistogram

異常值通常很容易在直方圖中被發現。例如,上圖中最左邊的點就是一個異常值。

異常值的一個方便的定義是,一個點落在第三四分位數之上或第一四分位數之下超過 1.5 倍的四分位距

OutlierScatterplot

當比較兩組資料之間的關係時,也可能出現異常值。這種型別的異常值可以很容易地在散點圖上識別出來。

當對資料執行最小二乘擬合時,通常最好在計算最佳擬合線之前丟棄異常值。對於沿 x 方向的異常值尤其如此,因為這些點可能會極大地影響結果。


另請參閱

直方圖, 最小二乘擬合, 散點圖 在 課堂中探索此主題

此條目由 John Renze 貢獻

使用 探索

參考文獻

Moore, D. S. 和 McCabe, G. P. Introduction to the Practice of Statistics, 3rd ed. New York: W. H. Freeman, 1999.

在 上被引用

異常值

請這樣引用

Renze, John. "異常值。" 來自 Web 資源,由 Eric W. Weisstein 建立。 https://mathworld.tw/Outlier.html

主題分類