主題
Search

二項分佈


BinomialDistribution

二項分佈給出了獲得正好 n 次成功的 離散機率分佈 P_p(n|N),在 N伯努利試驗 中(其中每次 伯努利試驗 的結果為真,機率為 p,為假,機率為 q=1-p)。因此,二項分佈由下式給出

P_p(n|N)=(N; n)p^nq^(N-n)
(1)
=(N!)/(n!(N-n)!)p^n(1-p)^(N-n),
(2)

其中 (N; n) 是一個 二項式係數。上面的圖顯示了在 N=20 次試驗中獲得 n 次成功的分佈,其中 p=q=1/2

二項分佈在 Wolfram 語言 中實現為BinomialDistribution[n, p].

在二項分佈中,獲得更多次成功,超過觀察到的 n 次成功的機率是

 P=sum_(k=n+1)^N(N; k)p^k(1-p)^(N-k)=I_p(n+1,N-n),
(3)

其中

 I_x(a,b)=(B(x;a,b))/(B(a,b)),
(4)

B(a,b)貝塔函式,而 B(x;a,b)不完全貝塔函式

二項分佈的 特徵函式

 phi(t)=(q+pe^(it))^N
(5)

(Papoulis 1984, p. 154)。分佈的 矩生成函式 M

M(t)=<e^(tn)>
(6)
=sum_(n=0)^(N)e^(tn)(N; n)p^nq^(N-n)
(7)
=sum_(n=0)^(N)(N; n)(pe^t)^n(1-p)^(N-n)
(8)
=[pe^t+(1-p)]^N
(9)
M^'(t)=N[pe^t+(1-p)]^(N-1)(pe^t)
(10)
M^('')(t)=N(N-1)[pe^t+(1-p)]^(N-2)(pe^t)^2+N[pe^t+(1-p)]^(N-1)(pe^t).
(11)

均值

mu=M^'(0)
(12)
=N(p+1-p)p
(13)
=Np.
(14)

關於 0 的

mu_1^'=mu=Np
(15)
mu_2^'=Np(1-p+Np)
(16)
mu_3^'=Np(1-3p+3Np+2p^2-3Np^2+N^2p^2)
(17)
mu_4^'=Np(1-7p+7Np+12p^2-18Np^2+6N^2p^2-6p^3+11Np^3-6N^2p^3+N^3p^3),
(18)

因此,關於 均值

mu_2=Np(1-p)=Npq
(19)
mu_3=Np(1-p)(1-2p)
(20)
mu_4=Np(1-p)[3p^2(2-N)+3p(N-2)+1].
(21)

偏度超額峰度

gamma_1=(1-2p)/(sqrt(Np(1-p)))
(22)
=(q-p)/(sqrt(Npq))
(23)
gamma_2=(6p^2-6p+1)/(Np(1-p))
(24)
=(1-6pq)/(Npq).
(25)

第一個 累積量

 kappa_1=np,
(26)

後續的 累積量遞推關係 給出

 kappa_(r+1)=pq(dkappa_r)/(dp).
(27)

平均偏差 由下式給出

 MD=sum_(k=0)^N|k-Np|(N; k)p^k(1-p)^(N-k).
(28)

對於特殊情況 p=q=1/2,這等於

MD=2^(-N)sum_(k=0)^(N)(N; k)|k-1/2N|
(29)
={(N!!)/(2(N-1)!!) for N odd; ((N-1)!!)/(2(N-2)!!) for N even,
(30)

其中 N!! 是一個 雙階乘。對於 N=1, 2, ..., 前幾個值因此是 1/2, 1/2, 3/4, 3/4, 15/16, 15/16, ... (OEIS A086116A086117)。一般情況由下式給出

 MD=2(1-p)^(N-|_Np_|)p^(|_Np_|+1)(|_Np_|+1)(N; |_Np_|+1).
(31)

Steinhaus (1999, pp. 25-28) 考慮了包含給定數量的穀物 n 的正方形 S(n,N,s) 的期望數量,在大小為 s 的棋盤上隨機分佈 N 粒穀物後,

 S(n,N,s)=sP_(1/s)(n|N).
(32)

N=s=64 給出了下表總結的結果。

nS(n,64,64)
023.3591
123.7299
211.8650
3 3.89221
4 0.942162
5 0.179459
6 0.0280109
7 0.0036840
8 4.16639×10^(-4)
9 4.11495×10^(-5)
10 3.59242×10^(-6)

對於大的 N,可以透過在值 n^~ 附近展開來獲得二項分佈的近似值,其中 P(n) 是最大值,即 dP/dn=0。由於 對數 函式是 單調 的,我們可以選擇展開 對數。設 n=n^~+eta,那麼

 ln[P(n)]=ln[P(n^~)]+B_1eta+1/2B_2eta^2+1/(3!)B_3eta^3+...,
(33)

其中

 B_k=[(d^kln[P(n)])/(dn^k)]_(n=n^~).
(34)

但我們正在最大值附近展開,所以,根據定義,

 B_1=[(dln[P(n)])/(dn)]_(n=n^~)=0.
(35)

這也意味著 B_2 是負的,所以我們可以寫成 B_2=-|B_2|。現在,取 (◇) 的 對數 得到

 ln[P(n)]=lnN!-lnn!-ln(N-n)!+nlnp+(N-n)lnq.
(36)

對於大的 nN-n,我們可以使用 斯特林近似

 ln(n!) approx nlnn-n,
(37)

所以

(d[ln(n!)])/(dn) approx (lnn+1)-1
(38)
=lnn
(39)
(d[ln(N-n)!])/(dn) approx d/(dn)[(N-n)ln(N-n)-(N-n)]
(40)
=[-ln(N-n)+(N-n)(-1)/(N-n)+1]
(41)
=-ln(N-n),
(42)

 (dln[P(n)])/(dn) approx -lnn+ln(N-n)+lnp-lnq.
(43)

為了找到 n^~,將此表示式設定為 0 並求解 n,

 ln((N-n^~)/(n^~)p/q)=0
(44)
 (N-n^~)/(n^~)p/q=1
(45)
 (N-n^~)p=n^~q
(46)
 n^~(q+p)=n^~=Np,
(47)

因為 p+q=1。我們現在可以找到展開式中的項

B_2=[(d^2ln[P(n)])/(dn^2)]_(n=n^~)
(48)
=-1/(n^~)-1/(N-n^~)
(49)
=-1/(Npq)
(50)
=-1/(Np(1-p))
(51)
B_3=[(d^3ln[P(n)])/(dn^3)]_(n=n^~)
(52)
=1/(n^~^2)-1/((N-n^~)^2)
(53)
=(q^2-p^2)/(N^2p^2q^2)
(54)
=(1-2p)/(N^2p^2(1-p)^2)
(55)
B_4=[(d^4ln[P(n)])/(dn^4)]_(n=n^~)
(56)
=-2/(n^~^3)-2/((n-n^~)^3)
(57)
=(2(p^2-pq+q^2))/(N^3p^3q^3)
(58)
=(2(3p^2-3p+1))/(N^3p^3(1-p)^3)).
(59)
BinomialGaussian

現在,將分佈視為連續的,

 lim_(N->infty)sum_(n=0)^NP(n) approx intP(n)dn=int_(-infty)^inftyP(n^~+eta)deta=1.
(60)

由於每一項都比前一項小 1/N∼1/sigma^2 階,我們可以忽略高於 B_2 的項,所以

 P(n)=P(n^~)e^(-|B_2|eta^2/2).
(61)

機率必須歸一化,所以

 int_(-infty)^inftyP(n^~)e^(-|B_2|eta^2/2)deta=P(n^~)sqrt((2pi)/(|B_2|))=1,
(62)

P(n)=sqrt((|B_2|)/(2pi))e^(-|B_2|(n-n^~)^2/2)
(63)
=1/(sqrt(2piNpq))exp[-((n-Np)^2)/(2Npq)].
(64)

定義 sigma^2=Npq,

 P(n)=1/(sigmasqrt(2pi))exp[-((n-n^~)^2)/(2sigma^2)],
(65)

這是一個 正態分佈。因此,對於任何固定的 p(即使 p 很小),當 N 趨於無窮大時,二項分佈可以近似為 正態分佈

如果 N->inftyp->0Np->lambda 這樣的方式,那麼二項分佈收斂到 泊松分佈,其 均值lambda

xy 是獨立的二項 隨機變數,由引數 n,pm,p 表徵。條件機率 x,給定 x+y=k,是

 P(x=i|x+y=k)=(P(x=i,x+y=k))/(P(x+y=k)) 
=(P(x=i,y=k-i))/(P(x+y=k)) 
=(P(x=i)P(y=k-i))/(P(x+y=k)) 
=((n; i)p^i(1-p)^(n-i)(m; k-i)p^(k-i)(1-p)^(m-(k-i)))/((n+m; k)p^k(1-p)^(n+m-k)) 
=((n; i)(m; k-i))/((n+m; k)).
(66)

請注意,這是一個 超幾何分佈


另請參閱

二項式, 棣莫弗-拉普拉斯定理, 高爾頓板, 超幾何分佈, 負二項分佈, 正態分佈, 泊松分佈, 一維隨機遊走 在 課堂中探索此主題

使用 探索

參考文獻

Beyer, W. H. CRC 標準數學表格,第 28 版。 Boca Raton, FL: CRC Press, p. 531, 1987.Papoulis, A. 機率、隨機變數和隨機過程,第 2 版。 New York: McGraw-Hill, pp. 102-103, 1984.Press, W. H.; Flannery, B. P.; Teukolsky, S. A.; 和 Vetterling, W. T. "不完全貝塔函式,學生 t 分佈,F 分佈,累積二項分佈。" §6.2 在 FORTRAN 數值食譜:科學計算的藝術,第 2 版。 Cambridge, England: Cambridge University Press, pp. 219-223, 1992.Spiegel, M. R. 機率與統計理論和問題。 New York: McGraw-Hill, pp. 108-109, 1992.Steinhaus, H. 數學快照,第 3 版。 New York: Dover, 1999.

在 上被引用

二項分佈

請引用本文為

Weisstein, Eric W. "二項分佈。" 來自 Web 資源。 https://mathworld.tw/BinomialDistribution.html

學科分類