数字による法違反

Aug 31 2020

特別捜査官ベンフォードは、悪意のある創造的な会計の3番目の未解決の事件に悩まされており、不正番号タスクフォースから自発的に引退します。数値エントリの最初の桁を数えるだけで偽造された元帳を検出するベンフォードの能力は非常に有名であるため、法律には私たちの紋章の英雄の名前が付けられています。

ベンフォードの法則:正直な会計シートでは、すべての数値エントリのほぼ1⁄3の最初の桁は「1」である必要があり、「2」やその他の数値よりもはるかに多いです。各数字が最初の桁であるカウントは、「9」が最も少ない数字の最初の桁である減少パターンに適合します。

この方法論は、悪意のある会計士がほとんど10進数をジャグリングしたため、何十年にもわたるサービスを通じてベンフォードに役立ちました。しかし、何年にもわたって、他の記数法が関係していたため、2つのケースはひび割れていませんでした。すべての正の整数は疑わしいです。

  1. 未解決のケース1。ベンフォードは、最も古い既知の記数法を認識し、その最初の桁が有罪判決につながらないことを知っていました。

  2. 未解決のケース2。ベンフォードは、この番号付けシステムを事実上すべての最新のコンピューターで採用されているものとして認識し、最初の桁に手がかりがないことを再び認めなければなりませんでした。

ついに、悲しいかな、最新の事件がやってきた。

  1. 未解決のケース3。ベンフォードはこれまでこの番号付けシステムに遭遇したことはありませんでしたが、エントリを見ると、それらも「法則」に反することに気づきました。ベンフォードはあきらめる前に、同じ逸脱した番号付けシステムが何世紀にもわたって学界で見られたことを知りましたが、まれであり、実際にはいくつかの巧妙に効率的なデジタルコンピュータの基礎となっています。

ケース1、2、3の番号付けシステムは何ですか?なぜそれらはそれほど無法なのですか?

報奨金の課題:これらの場合、ベンフォードの後任である特別捜査官の後継者は、エントリの2桁目を数えることで、より成功することができますか?彼らの予想される数字の頻度は何でしょうか?

(汚い言葉遊びは進行中ではありません。)

回答

12 JeremyDover Aug 31 2020 at 08:44

答えは次のように思います。

ケース1:

単項、タリー算術としても知られています。各数字はいくつかの記号(通常は数字の1に似た縦のスラッシュ記号)で示されるため、最初の「数字」は常に同じです。もちろん、これは最も古いカウント方法です。

ケース2:

バイナリ。繰り返しますが、すべての数値の最初の桁は1であるため、ベンフォードの法則は役に立ちません。バイナリは、ほとんどの最新のコンピュータアーキテクチャの基盤です。

ケース3:

バランスの取れた3進数。平衡三進法では、桁は1、0、-1であり、すべての正の数の最初の桁は常に1です。平衡三進法が特定の数学演算をより効率的にするいくつかの理論的理由があり、いくつかの基礎として使用されたようです。過去のソビエトコンピュータ。

ボーナス:

2桁目を見ると、2進数の場合とバランスの取れた3進数の場合に統計的な偏りが見られますが、単項の場合には見られません。バイナリの場合、ウィキペディアで提供されている分布の単純な一般化を使用すると、2桁目が0になる確率は次のようになります。$\log_2(3) -\log_2(2)$、約58.5%です。

バランスの取れた3進数の場合、2桁目の分布は、3進数に似ているはずですが、微妙に異なります。これを実現するために、バランスの取れた3値分布を通常の3値分布に関連付けます。通常の3項分布では、数値がで始まる確率$n$ (数字の文字列として)は $\log_3(n+1) - \log_3(n)$

表示を簡単にするために、バランスの取れた3進数が3桁未満の数値は無視できます。これは、整数の無限大を調べると、その下にあるルールには有限の数の例外がなくなるためです。また、記号を使用します$+$$\cdot$ そして $-$ バランスの取れた3進数。

最初に2桁目が $-$。三進法に変換すると、$[+ - - , + - +] \equiv [12,21]$$[+ - - -, + - + +] \equiv [112,211]$$[+ - - - -, + - + + +] \equiv [1112,2111]$、 等々。したがって、バランスの取れた3進数の2桁目は次のようになります。$-$ 対応する3進数がで始まる場合にのみ $12$$112$$1112$$\ldots$; $20$; または$21$、で始まるものを除いて $212$$2112$$21112$$\ldots$。これが発生する確率を取得するために、通常の3項範囲のベンフォード分布から関連するすべての確率を合計します。マグマ計算機を使用して、おおよその確率46.5%を取得します。

ここで、2桁目が $\cdot$。上記のように、この条件を満たすバランスの取れた3進数の場合、同等の3進数は$[ + \cdot - , + \cdot + ] \equiv [22 , 101]$$[ + \cdot - -, + \cdot + +] \equiv [212 , 1011]$$[ + \cdot - - -, + \cdot + + +] \equiv [2112 , 10111]$など。前と同じように、バランスの取れた3進数には2桁目があります。 $\cdot$ 対応する3進数がで始まる場合 $212$$2112$$21112$$\ldots$; $22$; または$10$、で始まるものを除いて $102$$1012$$10112$$\ldots$。これにより、約30.63%の確率が得られます。

2桁目 $+$、前の結果を加算して1から減算することもできますが、チェックとして同じ方法で計算してみましょう。上記のように、$[ + + - , + + + ] \equiv [102 , 111]$$[ + + - -, + + + +] \equiv [1012 , 1111]$$[ + + - - -, + + + + +] \equiv [10112 , 11111]$。したがって、2番目のバランスのとれた3進数は$+$ 対応する3進数がで始まる場合 $102$$1012$$10112$$\ldots$; または$11$、で始まるものを除く $112$$1112$$11112$$\ldots$。上記のように、この確率の合計は22.87%になります。

比較のために、通常の3進数の2桁目の確率は、40.22%、32.47%、および27.32%です。 $0$$1$ そして $2$、それぞれ。