Kısaca Benford Yasası
Benford Yasası, “İlk Basamak Kanunu” olarak da bilinen, çeşitli veri setlerindeki sayısal değerlerin baştaki rakamlarının sıklığını tahmin eden istatistiksel bir ilkedir.
Bu yasaya göre; küçük rakamlar (1 ve 2 gibi) bir veri setinde ilk basamak olarak büyük rakamlardan (8 ve 9 gibi) daha sık karşımıza çıkar. Bu dağılım nüfus verileri, finansal işlemler ve doğal olaylar gibi çok çeşitli gerçek dünya veri setlerinde gözlemlenebilir.
Benford Yasası’nın Kökeni
Benford Yasası’nın arkasındaki temel fikir, 1881 yılında Kanadalı astronom Simon Newcomb tarafından fark edilmiştir. Newcomb, bilimsel hesaplamalar için sıkça kullanılan logaritma tablolarında küçük rakamların bulunduğu sayfaların daha büyük rakamlarla başlayan sayfalara kıyasla daha fazla kullanıldığını gözlemlemiştir. Ancak fenomen, 1938 yılında Amerikalı fizikçi Frank Benford tarafından incelenip yayımlandığında bu ismi almıştır.
1946’da L. V. Furlan aynı savı Almanca olarak açıklamıştır. Savın en ayrıntılı matematiksel açıklaması ve matematiksel ispatı ise, 1988 yılında Theodore P. Hill tarafından yapılmıştır.
Matematiksel Açıklaması
Benford Yasası, bir sayının ilk basamağının \(d\) olma olasılığını şu logaritmik formülle ifade etmektedir:
\[
P(d) = \log_{10}(d+1) – \log_{10}(d)
\]
Örneğin; ilk rakamın 1 olma olasılığı %30,1 iken, 9 olma olasılığı sadece %4,6’dır. Bu dağılım, kullanılan ölçüm birimlerinden bağımsızdır ve farklı ölçeklerdeki veri setlerinde tutarlıdır.
Neden İşe Yarıyor?
Benford Yasası’nın altındaki neden, sayıların büyümesinin logaritmik doğasında yatmaktadır. Sayılar birden fazla büyüklük sırasına yayıldığında (nüfus, hisse fiyatları, nehir uzunlukları, vb.), bu sayıların ilk basamaklarının logaritmik bir dağılıma göre şekillendiği gözlemlenmektedir. Bu durum, verilerin genellikle üstel bir büyüme eğilimi göstermesiyle ilgilidir.
Gerçek Hayattaki Uygulamaları
Benford Yasası, veri setlerinde anormallik tespit etmek için kullanılan önemli bir araçtır. Özellikle sahtecilik tespitinde yaygın olarak kullanılmaktadır. Denetçiler, finansal verilerdeki tutarsızlıkları bu yasayla belirleyerek sahte vergi beyanları veya manipüle edilmiş finansal kayıtları ortaya çıkarabilmektedirler.
Benford Yasası ile Sahtecilik Tespiti
1990’larda araştırmacı Mark Nigrini, Benford Yasası’nı vergi dolandırıcılığını tespit etmek için kullanmıştır. Sahte veriler sıklıkla Benford Yasası’nın öngördüğü dağılımdan sapmaktadır. Bu yaklaşım, vergi denetçileri ve dolandırıcılık araştırmacıları tarafından sahtecilik tespitinde hızlı bir tarama yöntemi olarak kullanılmaktadır.
Seçim sonuçlarından dolandırıcılık tespitine, veri güvenliğinin sağlanmasından dijital görüntülerin manipüle edilip edilmediğine kadar birçok alanda kullanılan bu istatistiksel fenomen, sayılar dünyasındaki gizli kalıpları keşfetmek için de bir fırsat sunmaktadır.
Her veri setine uygulanamasa da anormallik tespitinde ve veri güvenilirliğinin sağlanmasında değerli bir kaynak olmayı sürdürmektedir.
Eğer bir veri seti Benford dağılımına uymuyorsa, bu verilerin yapay olarak değiştirilmiş olabileceği anlamına gelebilmektedir.
Benford Yasası’na Uyan Veriler
Benford Yasası’na uyan veri setleri genellikle geniş bir aralığa yayılan ve doğal olarak ortaya çıkan sayıları içermektedir. Finansal işlemler, borsa verileri, nüfus istatistikleri, fiziksel sabitler ve nehir uzunlukları bu tür veri setlerine örnek verilebilir. Bu veri setlerinin ortak özelliği, sayıların geniş bir büyüklük aralığında değişkenlik göstermesidir.
Benford Yasası’na Uymayan Veriler
Her veri seti Benford Yasası’na uymaz. Örneğin; piyango numaraları, telefon numaraları veya sınırlı bir aralıktaki sayılar yasaya uymamaktadır. Ayrıca belirli bir sınır içinde toplanan veri setleri (insan boyları, IQ skorları, vb.) genellikle yasadan sapmaktadır.
Tarihi Örnekler
Benford Yasası, tarihte ve günümüzde pek çok bağlamda kullanılmıştır. Örneğin; Yunanistan hükümetinin Euro Bölgesi’ne katılmak için ekonomik verilerini manipüle ettiği iddiası, bu yasa kullanılarak incelenmiş ve tutarsızlıklar tespit edilmiştir.
BONUS
Eleştiriler ve Sınırlamalar
Benford Yasası güçlü bir araç olsa da her durumda geçerli değildir. Eleştirmenler, her veri setinin doğal olarak bu yasaya uymayabileceğini ve yanlış kullanımların hatalı sonuçlara yol açabileceğini vurgulamaktadır. Yasa, özellikle geniş bir büyüklük aralığına yayılan büyük veri setlerinde etkili olmaktadır ancak küçük veya sınırlı veri setlerinde bu dağılım gözlemlenmeyebilmektedir.
Kapak Fotoğrafı: Photo by Anna Nekrashevich