相關係數,有時也稱為互相關係數、皮爾遜相關係數 (PCC)、皮爾遜 、皮爾遜積矩相關係數 (PPMCC) 或雙變數相關,是一個用於衡量對原始資料進行最小二乘擬合質量的量。 為了定義相關係數,首先考慮一組
個數據點
圍繞各自均值的平方和
、
和
,
|
(1)
| |||
|
(2)
| |||
|
(3)
| |||
|
(4)
| |||
|
(5)
| |||
|
(6)
| |||
|
(7)
| |||
|
(8)
| |||
|
(9)
| |||
|
(10)
| |||
|
(11)
| |||
|
(12)
|
|
(13)
| |||
|
(14)
| |||
|
(15)
|
|
(16)
|
由下式給出
|
(17)
| |||
|
(18)
|
以及方程中的係數
|
(19)
|
由下式給出
|
(20)
|
相關係數 (有時也表示為
) 然後由下式定義
|
(21)
| |||
|
(22)
|
相關係數也稱為積矩相關係數或皮爾遜相關。 上圖顯示了對噪聲資料進行線性擬合的相關係數。
相關係數具有重要的物理意義。 為了理解這一點,定義
|
(23)
|
並將 的“期望”值表示為
。 然後
的和為
|
(24)
| |||
|
(25)
| |||
|
(26)
| |||
|
(27)
| |||
|
(28)
| |||
|
(29)
| |||
|
(30)
| |||
|
(31)
| |||
|
(32)
| |||
|
(33)
|
則誤差平方和為
|
(34)
| |||
|
(35)
| |||
|
(36)
| |||
|
(37)
| |||
|
(38)
| |||
|
(39)
| |||
|
(40)
| |||
|
(41)
|
殘差平方和為
|
(42)
| |||
|
(43)
| |||
|
(44)
| |||
|
(45)
| |||
|
(46)
|
但是
|
(47)
| |||
|
(48)
|
所以
|
(49)
| |||
|
(50)
| |||
|
(51)
| |||
|
(52)
|
並且
|
(53)
|
因此,相關係數 的平方由下式給出
|
(54)
| |||
|
(55)
| |||
|
(56)
|
換句話說, 是由迴歸解釋的
的比例。
如果存在完全相關性,則透過求解最佳擬合 和
得到的直線重合(因為所有資料點都位於它們之上),因此求解 (◇) 中的
並將其等同於 (◇) 得出
|
(57)
|
因此, 且
,得出
|
(58)
|
相關係數與原點和尺度無關,因此
|
(59)
|
其中
|
(60)
| |||
|
(61)
|