Формула Бенфорда
Добавлено: 27 мар 2009, 12:57
Формула Бенфорда
В 1938 году американский физик Фрэнк Бенфорд листал в библиотеке таблицы логарифмов. Обнаружив ту же закономерность, что и Ньюкомб, он пошел гораздо дальше. Бенфорд проанализировал справочные данные о площадях поверхности 335 рек, химических параметрах тысяч химических соединений, номерах домов из адресного справочника, результатах бейсбольных матчей. В итоге ученый обнаружил, что везде соблюдается одна и та же закономерность: чисел, начинающихся с единицы, гораздо больше, чем начинающихся с любой другой цифры. Пытаясь выразить обнаруженную закономерность математически, Фрэнк Бенфорд вывел формулу, описывающую вероятность (p) того, что случайная десятичная дробь будет начинаться с числа n:
p = lg (n + 1) – lg (n).
Из формулы ясно: чем меньше цифра, тем больше вероятность того, что с нее будет начинаться случайная десятичная дробь.
В 1961 году Роберт Пинкхем заметил еще одну закономерность. Закон Бенфорда работает и при любой единице измерений! То есть, если измерить площадь рек в квадратных километрах и исследовать частоту появления разных чисел в качестве первой цифры, обнаружится, что эта частота соответствует Закону Бенфорда. Даже если измерить площадь тех же самых рек в квадратных футах – результат также будет соответствовать Закону Бенфорда. Подобные утверждения справедливы и для различных валют. Например, если цены, выраженные в долларах, соответствуют распределению Бенфорда, то это не изменится даже при их пересчете по курсу в евро или рубли.
Простым языком Закон Бенфорда можно описать так: маленьких вещей в мире всегда больше, чем больших. Маленьких озер всегда больше, чем больших, маленьких камней – больше, маленьких книг – больше, фотографий, на которых изображен один человек, больше, чем групповых, низких домов больше, чем многоэтажных, незначительных аварий на дорогах больше, чем серьезных. В бухгалтерии проводок на маленькие суммы больше, чем на большие. Почему так происходит закон не объясняет, поскольку он является эмпирическим, но происходит все именно так.
В 1997 году Нигрини и Миттермайер разработали шесть математических тестов, основанных на Законе Бенфорда. Эти тесты первыми были введены в практику международной аудиторской компанией «Эрнст и Янг» для анализа и выявления нерегулярностей в данных клиентов при аудите.
Первый вопрос, на который должен ответить аудитор при проведении теста: является ли набор неких данных Бенфорд-последовательностью или нет? То есть соответствует ли он распределению Бенфорда. Самый простой способ – представить, откуда эти данные берутся. Если они получаются в результате естественного течения событий или присутствуют в природе «сами по себе», то скорее всего они будут соответствовать Закону Бенфорда. Вот некоторые примеры данных, соответствующих Закону Бенфорда:
номера платежных поручений от различных покупателей (вся совокупность);
суммы платежей от покупателей;
суммы в авансовых отчетах;
остатки товаров на складах;
номера домов в адресах клиентов.
В 1938 году американский физик Фрэнк Бенфорд листал в библиотеке таблицы логарифмов. Обнаружив ту же закономерность, что и Ньюкомб, он пошел гораздо дальше. Бенфорд проанализировал справочные данные о площадях поверхности 335 рек, химических параметрах тысяч химических соединений, номерах домов из адресного справочника, результатах бейсбольных матчей. В итоге ученый обнаружил, что везде соблюдается одна и та же закономерность: чисел, начинающихся с единицы, гораздо больше, чем начинающихся с любой другой цифры. Пытаясь выразить обнаруженную закономерность математически, Фрэнк Бенфорд вывел формулу, описывающую вероятность (p) того, что случайная десятичная дробь будет начинаться с числа n:
p = lg (n + 1) – lg (n).
Из формулы ясно: чем меньше цифра, тем больше вероятность того, что с нее будет начинаться случайная десятичная дробь.
В 1961 году Роберт Пинкхем заметил еще одну закономерность. Закон Бенфорда работает и при любой единице измерений! То есть, если измерить площадь рек в квадратных километрах и исследовать частоту появления разных чисел в качестве первой цифры, обнаружится, что эта частота соответствует Закону Бенфорда. Даже если измерить площадь тех же самых рек в квадратных футах – результат также будет соответствовать Закону Бенфорда. Подобные утверждения справедливы и для различных валют. Например, если цены, выраженные в долларах, соответствуют распределению Бенфорда, то это не изменится даже при их пересчете по курсу в евро или рубли.
Простым языком Закон Бенфорда можно описать так: маленьких вещей в мире всегда больше, чем больших. Маленьких озер всегда больше, чем больших, маленьких камней – больше, маленьких книг – больше, фотографий, на которых изображен один человек, больше, чем групповых, низких домов больше, чем многоэтажных, незначительных аварий на дорогах больше, чем серьезных. В бухгалтерии проводок на маленькие суммы больше, чем на большие. Почему так происходит закон не объясняет, поскольку он является эмпирическим, но происходит все именно так.
В 1997 году Нигрини и Миттермайер разработали шесть математических тестов, основанных на Законе Бенфорда. Эти тесты первыми были введены в практику международной аудиторской компанией «Эрнст и Янг» для анализа и выявления нерегулярностей в данных клиентов при аудите.
Первый вопрос, на который должен ответить аудитор при проведении теста: является ли набор неких данных Бенфорд-последовательностью или нет? То есть соответствует ли он распределению Бенфорда. Самый простой способ – представить, откуда эти данные берутся. Если они получаются в результате естественного течения событий или присутствуют в природе «сами по себе», то скорее всего они будут соответствовать Закону Бенфорда. Вот некоторые примеры данных, соответствующих Закону Бенфорда:
номера платежных поручений от различных покупателей (вся совокупность);
суммы платежей от покупателей;
суммы в авансовых отчетах;
остатки товаров на складах;
номера домов в адресах клиентов.