kireev: (Default)
kireev ([personal profile] kireev) wrote2015-05-04 08:13 am

О нулях в результатах президентских выборах в Белоруссии 2010 г. по районам

В обсуждении нарисованных результатов выборов президента Казахстана в ряде областей поднялся вопрос о том, где же этот "обогуевский агрегатор" всплывет в следующий раз. В Белоруссии? Белоруссию я на это уже проверял: нет там такого. Но я и Казахстан проверил и там тоже таким методом не рисовали, а надо было каждую область еще проверить. Поэтому я уже вернулся к президентским выборам в Белоруссии и проверил области. Тоже нет. Даже районы стал проверять, хотя там уже маловато избирателей: тоже нет. Зато пока проверял я обратил внимание, что там проценты за Лукашенко уж очень часто на ноль заканчиваются. Что значит глаз наметан, а? :) Стал считать. Действительно, слишком часто выпадают нули!

Каждый может перепроверить. В Белоруссии 148 районов (сельские плюс городские). Какова вероятность выпадения каждого отдельного числа от 0 до 9 на конце процентов за Лукашенко? Один из десяти. Следовательно, в среднем каждое число из 148 случаев выпадет 14,8 раз. А у Лукашенко на конце сотых долей процента нули выпадают не 14, не 15 и не 20 раз! А сразу 35 раз! В почти четверти случаев, а не в одном из десяти! Вот так выглядят последние цифры в процентах за Лукашенко на графике.



Есть наблюдение, что люди случайно выбирают четные числа чаще, чем нечетные, и это даже видно на этом графике: 2 выбирается чаще, чем 1.  4 выбирается чаще, чем 3. 6 выбирается чаще, чем 5. 8 выбирается чаще, чем 7. Ну и 0 на конце вне конкуренции: все же любовь в красивым числам у людей неистребима, что было еще наглядно показано на думских выборах в России. Собственно, человеческий мозг не в состоянии совершенно случайно выбрать цифры, поэтому существуют генераторы случайных чисел.

Не только один ноль на конце, но и сразу два нуля на конце встречаются непропорционально часто! С точностью до процента результаты совпали сразу в восьми районах! Вероятность этого должна составлять 1 из 100. Районов 148. То есть в среднем их должно быть 1,48. 2-3 - нормально. Ну, 4 таких случая. Пара вариантов действительно там встречается в четырех случаях. Но не более того. Единственным исключением и сразу восемь выпаданий именно у двух нулей на конце!

Математик [livejournal.com profile] a_shen мне подсказал, что вероятность выпадения последнего нуля по крайне мере в 35 случаях из 148 составляет примерно 0,0001%. Каждый может в бытовых условиях проверить насколько это вероятно. Возьмите телефонные номера ста своих друзей и знакомых (я лично даже буду вам завидовать, если у вас их столько есть) и посмотрите как часто выпадает ноль на конце. 26 наберется? Это будет такая же вероятность, как и 35 из 148. Ну или 20 телефонных номеров возьмите. При такой же вероятности нулем будут заканчиваться 10 и более номеров. Нет? А вот у Лукашенко заканчиваются.

А вероятность выпадения по крайней мере двух нулей в восьми случаях составляет чуть больше 0,01%. Вероятность двух этих событий (то есть по крайней мере 35 случаев одного нуля и по крайней мере 8 по два нуля) одновременно - несколько миллионных процента. И, замечу, это именно нули и именно у Лукашенко! Хотя по явке нули тоже в 21 случае выпадают, но это уже мелочи по сравнению с 35 нулями у Лукашенко.

Даже без всего этого результаты по районам на тех выборах убедительно говорят, что их просто рисовали. Это было известно даже до их публикации, потому что была куча убедительных свидетельств того, что сами результаты по стране просто были взяты от балды и не были связаны даже с фальсифицируемым подсчетом на участках! А если результаты по стране взяты от балды, и там нарушены все пропорции голосов за кандидатов, то и результаты по районам должны были просто рисоваться, ведь они по сумме должны совпадать с результатами по стране. То есть эти проценты являются продуктом человеческой деятельности, о чем я и говорил с самого начала.

Некоторые не соглашались со мной, что результаты этих выборов были нарисованы. Призываю их вернуться в мой блог, признать мою правоту или же объяснить появление этих нулей.

[identity profile] misha-b.livejournal.com 2015-05-04 05:14 pm (UTC)(link)
Интересное замечание, не думал об этом. Математически непонятно как расчитать, но написал програмку, которая случайно выбирает два целых числа 0--1000, округляет их отношение до сотых процента и считает последнюю цифру.

При выборкe размером в десять миллионов вероятность последнего нуля получилась 11.88767%.

Интересно, что если числа распределены случайно на интервале 0--100, то вероятность последнего нуля уже 22.5055%, а вероятность тройки 11.04397% (тоже значительно выше ожидаемого).

Размер эффекта явно недостаточно велик, чтобы объяснить белорусские выборы, да и с тройкой все наоборот, но любопытно.





[identity profile] barouh.livejournal.com 2015-05-04 05:18 pm (UTC)(link)
в Беларуси чисел меньше 1000 нет вообще - там все районы крупнее. На числах больше 10000 вероятность нуля будет близка к 10% (что видно из того, как стремительно эта вероятность падает в вашем тесте при переходе от десятков к сотням)

[identity profile] misha-b.livejournal.com 2015-05-04 05:28 pm (UTC)(link)
На 10000 эффект еще заметен при 10-миллионной выборке, но весьма мал 10.2%.

Однако возможен и такой вариант -- числа рисовали, но не что выбирали случайное круглое число, а считали отношение двух более или менее случайно выбранных небольших чисел с нужным результатом. Не знаю, насколько такой вариант реален.

[identity profile] barouh.livejournal.com 2015-05-04 06:33 pm (UTC)(link)
если бы сначала рисовали абсолютные числа, а потом бы считали проценты их делением, то излишка процентных чисел с нулем на конце не было бы

[identity profile] misha-b.livejournal.com 2015-05-04 06:37 pm (UTC)(link)
В смысле числа сравнимые с реальным населением? Но зачем так сложно рисовать?

[identity profile] barouh.livejournal.com 2015-05-04 07:13 pm (UTC)(link)
числа явки и голосов за Лукашенко в любом случае должны быть сравнимы с реальным населением - по условиям стоящей перед чиновниками задачи :) Явка за 90% количества избирателей, Лука за 80% от "проголосовавших"

но в данном случае числа видимо были повторичными - а сначала придумывали проценты. Поэтому избыток нулей в процентных значениях, а не в абсолютных

[identity profile] misha-b.livejournal.com 2015-05-04 07:19 pm (UTC)(link)
Ну, я бы выбрал два числа случайно в правильном диапазоне, а потом уже можно подогнать под население :)
ext_605364: geg MOPO4 (Default)

[identity profile] gegmopo4.livejournal.com 2015-05-04 07:33 pm (UTC)(link)
Поучите их подтасовкам ещё.

[identity profile] misha-b.livejournal.com 2015-05-04 07:37 pm (UTC)(link)
Да ладно, уж как-нибудь без меня обойдутся.