主題
Search

本福特定律


一種現象學定律,也稱為首位數字定律、首位數字現象或前導數字現象。本福特定律指出,在列表、統計表等中,數字 1 出現的機率約為 ∼30%,遠高於預期的 11.1%(即九個數字中的一個)。例如,透過檢查對數表並注意到首頁比後面的頁更破舊和汙損(Newcomb 1881),可以觀察到本福特定律。雖然本福特定律無疑適用於現實世界中的許多情況,但最近才透過 Hill (1998) 的工作給出了令人滿意的解釋。

本福特定律被角色 Charlie Eppes 用作類比,以幫助解決電視犯罪劇集NUMB3RS第二季“The Running Man” (2006) 中的一系列重大盜竊案。

本福特定律適用於非無量綱資料,因此資料的數值取決於單位。如果存在關於這些數字的通用機率分佈 P(x),那麼它在尺度變換下必須是不變的,因此

 P(kx)=f(k)P(x).
(1)

如果 intP(x)dx=1,則 intP(kx)dx=1/k,歸一化意味著 f(k)=1/k。對 k 求導並設定 k=1 得到

 xP^'(x)=-P(x),
(2)

解為 P(x)=1/x。雖然這不是一個合適的機率分佈(因為它發散),但物理定律和人類慣例都施加了截止值。例如,隨機選擇的街道地址遵循接近本福特定律的規律。

BenfordsLaw

如果 10 的許多冪次位於截止值之間,則第一個(十進位制)數字是 D 的機率由對數分佈給出

 P_D=(int_D^(D+1)P(x)dx)/(int_1^(10)P(x)dx)=log_(10)(1+1/D)
(3)

對於 D=1, ..., 9,如上所示並在下表中列出。

DP_DDP_D
10.3010360.0669468
20.17609170.0579919
30.12493980.0511525
40.0969190.0457575
50.0791812

然而,本福特定律不僅適用於尺度不變資料,也適用於從各種不同來源選擇的數字。解釋這一事實需要對乘法下隨機變數尾數中心極限定理進行更嚴格的研究。隨著變數數量的增加,密度函式接近上述對數分佈的密度函式。Hill (1998) 嚴格證明,從各種不同分佈中隨機抽樣得到的“分佈的分佈”實際上是本福特定律 (Matthews)。

本福特定律的一個引人注目的例子是 Plouffe 的“逆符號計算器”資料庫中的 5400 萬個實常數,其中 30% 以數字 1 開頭。下表取自幾個不同的來源的資料,顯示了 Benford (1938) 在其原始論文中彙編的首位數字的分佈。

列。標題123456789樣本
A河流,面積31.016.410.711.37.28.65.54.25.1335
B人口33.920.414.28.17.26.24.13.72.23259
C常數41.314.44.88.610.65.81.02.910.6104
D報紙30.018.012.010.08.06.06.05.05.0100
E比熱24.018.416.214.610.64.13.24.84.11389
F壓力29.618.312.89.88.36.45.74.44.7703
G馬力損失30.018.411.910.88.17.05.15.13.6690
H分子量26.725.215.410.86.75.14.12.83.21800
I排水量27.123.913.812.68.25.05.02.51.9159
J原子量47.218.75.54.46.64.43.34.45.591
Kn^(-1), sqrt(n)25.720.39.76.86.66.87.28.08.95000
L設計26.814.814.37.58.38.47.07.35.6560
M讀者文摘33.418.512.47.57.16.55.54.94.2308
N成本資料32.418.810.110.19.85.54.75.53.1741
OX 射線電壓27.917.514.49.08.17.45.15.84.8707
P美國聯盟32.717.612.69.87.46.44.95.63.01458
Q黑體31.017.314.18.76.67.05.24.75.41165
R地址28.919.212.68.88.56.45.65.05.0342
Sn^1, n^2...n!25.316.012.010.08.58.86.87.15.5900
T死亡率27.018.615.79.46.76.57.24.84.1418
平均值30.618.512.49.48.06.45.14.94.71011
機率誤差+/-0.8+/-0.4+/-0.4+/-0.3+/-0.2+/-0.2+/-0.2+/-0.3

下表給出了使用多種不同方法遵循本福特定律的尾數首位數字的分佈。

方法OEIS序列
聖拉格A0554391, 2, 3, 1, 4, 5, 6, 1, 2, 7, 8, 9, ...
洪特A0554401, 2, 1, 3, 1, 4, 2, 5, 1, 6, 3, 1, ...
最大余數,黑爾配額A0554411, 2, 3, 4, 1, 5, 6, 7, 1, 2, 8, 1, ...
最大余數,德魯普配額A0554421, 2, 3, 1, 4, 5, 6, 1, 2, 7, 8, 1, ...

另請參閱

對數分佈

使用 探索

參考文獻

Barlow, J. L. and Bareiss, E. H. "On Roundoff Error Distributions in Floating Point and Logarithmic Arithmetic." Computing 34, 325-347, 1985.Benford, F. "The Law of Anomalous Numbers." Proc. Amer. Phil. Soc. 78, 551-572, 1938.Bogomolny, A. "Benford's Law and Zipf's Law." http://www.cut-the-knot.org/do_you_know/zipfLaw.shtml.Boyle, J. "An Application of Fourier Series to the Most Significant Digit Problem." Amer. Math. Monthly 101, 879-886, 1994.Flehinger, B. J. "On the Probability that a Random Integer Has Initial Digit A." Amer. Math. Monthly 73, 1056-1061, 1966.Franel, J. Naturforschende Gesellschaft, Vierteljahrsschrift (Zürich) 62, 286-295, 1917.Havil, J. "Benford's Law." §14.2 in Gamma: Exploring Euler's Constant. Princeton, NJ: Princeton University Press, pp. 145-155, 2003.Hill, T. P. "Base-Invariance Implies Benford's Law." Proc. Amer. Math. Soc. 12, 887-895, 1995a.Hill, T. P. "The Significant-Digit Phenomenon." Amer. Math. Monthly 102, 322-327, 1995b.Hill, T. P. "A Statistical Derivation of the Significant-Digit Law." Stat. Sci. 10, 354-363, 1995c.Hill, T. P. "The First Digit Phenomenon." Amer. Sci. 86, 358-363, 1998.Knuth, D. E. "The Fraction Parts." §4.2.4B in The Art of Computer Programming, Vol. 2: Seminumerical Algorithms, 3rd ed. Reading, MA: Addison-Wesley, pp. 254-262, 1998.Ley, E. "On the Peculiar Distribution of the U.S. Stock Indices Digits." Amer. Stat. 50, 311-313, 1996.Livio, M. The Golden Ratio: The Story of Phi, the World's Most Astonishing Number. New York: Broadway Books, pp. 232-236, 2002.Matthews, R. "The Power of One." http://www.fortunecity.com/emachines/e11/86/one.html.Newcomb, S. "Note on the Frequency of the Use of Digits in Natural Numbers." Amer. J. Math. 4, 39-40, 1881.Nigrini, M. J. The Detection of Income Tax Evasion Through an Analysis of Digital Frequencies. Ph.D. thesis. Cincinnati, OH: University of Cincinnati, 1992.Nigrini, M. "A Taxpayer Compliance Application of Benford's Law." J. Amer. Tax. Assoc. 18, 72-91, 1996.Nigrini, M. "I've Got Your Number." J. Accountancy 187, pp. 79-83, May 1999. http://www.aicpa.org/pubs/jofa/may1999/nigrini.htm.Nigrini, M. Digital Analysis Using Benford's Law: Tests Statistics for Auditors. Vancouver, Canada: Global Audit Publications, 2000.Plouffe, S. "Graph of the Number of Entries in Plouffe's Inverter." http://www.lacim.uqam.ca/~plouffe/statistics.html.Raimi, R. A. "The Peculiar Distribution of First Digits." Sci. Amer. 221, 109-119, Dec. 1969.Raimi, R. A. "On the Distribution of First Significant Digits." Amer. Math. Monthly 76, 342-348, 1969.Raimi, R. A. "The First Digit Phenomenon." Amer. Math. Monthly 83, 521-538, 1976.Schatte, P. "Zur Verteilung der Mantisse in der Gleitkommadarstellung einer Zufallsgröße." Z. Angew. Math. Mech. 53, 553-565, 1973.Schatte, P. "On Mantissa Distributions in Computing and Benford's Law." J. Inform. Process. Cybernet. 24, 443-455, 1988.Sloane, N. J. A. Sequences A055439, A055440, A055441, and A055442 in "The On-Line Encyclopedia of Integer Sequences."

引用為

Weisstein, Eric W. “本福特定律。” 來自 Web 資源。 https://mathworld.tw/BenfordsLaw.html

主題分類