在真實世界的數據中,首位數字並非均等分佈。 數字 1 出現的機率高達 30.1%,而 9 只有 4.6%。 這個反直覺的規律稱為班佛定律(Benford's Law), 由通用電氣工程師 Frank Benford 在 1938 年正式發表。 他翻閱對數表時發現,書中前面幾頁(對應小首位數)磨損得特別嚴重——這讓他開始思考數字分布的問題。
| 首位數字 | 公式 | 計算值 | 比較 |
|---|
第二位數(0–9)也有預期分布,0 的機率最高(12.0%),9 最低(8.5%)。 與第一位數定律相比,第二位數定律能偵測更細微的人為痕跡, 特別是捏造者「刻意調整」數字大小時留下的特徵。
MAD(平均絕對偏差)衡量觀察分布與班佛預測值之間的平均差距。 數值越小代表越符合班佛定律。Nigrini(2012)提出以下四段評級:
| MAD 範圍 | 評級 | 解讀 | 建議行動 |
|---|---|---|---|
| < 0.006 | Closely Conforms | 高度符合班佛定律,自然規律性強 | 無需特別行動 |
| 0.006 – 0.012 | Acceptable | 可接受,輕微偏差在正常範圍內 | 可結合其他指標判斷 |
| 0.012 – 0.015 | Marginally Acceptable | 邊際,需留意數據來源與品質 | 建議搭配第二位數 Z 檢定 |
| > 0.015 | Non-Conformity | 顯著偏離,高度懷疑數據被人為操控 | 建議深入審查原始數據 |