對於具有分佈 且已知 總體均值
的單個 變數
,總體方差
,通常也寫作
,定義為
|
(1)
|
其中 是總體均值,而
表示
的 期望值。對於具有
個可能值
的 離散分佈,總體方差因此為
|
(2)
|
而對於 連續分佈,它由下式給出
|
(3)
|
因此,方差等於第二個 中心矩 。
請注意,在將 解釋為方差時,需要謹慎,因為符號
也常被用作與方差的平方根相關但不等同的引數,例如在對數正態分佈、麥克斯韋分佈和瑞利分佈中。
如果基礎分佈未知,則可以計算樣本方差為
|
(4)
|
其中 是樣本均值。
請注意,上面定義的樣本方差 不是 總體方差
的無偏估計量。為了獲得
的無偏估計量,有必要改為定義“偏差校正樣本方差”
|
(5)
|
和
之間的區別是常見的混淆來源,在查閱文獻以確定使用哪種約定,特別是當不明確的符號
通常用於兩者時,應格外小心。資料列表的偏差校正樣本方差
實現為方差[列表]。
方差的平方根稱為標準差。
給出總體方差的有偏估計量的原因是,實際上是從資料本身估計了兩個自由引數
和
。在這種情況下,使用 Student's t 分佈 而不是 正態分佈 作為模型是合適的,因為,非常籠統地說,Student's t 分佈是在不知道
的情況下可以做到的“最佳”選擇。
形式上,為了從先驗未知 均值(即均值是從樣本本身估計的)的 個元素的樣本中估計總體方差
,我們需要
的無偏估計量。這由 k 統計量
給出,其中
|
(6)
|
而 是未針對偏差校正的樣本方差。
事實證明,量 具有 卡方分佈。
對於資料集 ,透過線性變換獲得的資料的方差由下式給出
|
(7)
| |||
|
(8)
| |||
|
(9)
| |||
|
(10)
| |||
|
(11)
| |||
|
(12)
|
對於多個變數,方差使用協方差的定義給出,
|
(13)
| |||
|
(14)
| |||
|
(15)
| |||
|
(16)
| |||
|
(17)
|
線性求和具有類似的形式
|
(18)
| |||
|
(19)
| |||
|
(20)
|
這些方程可以使用協方差矩陣表示。