kireev: (Default)
[personal profile] kireev
Хороший статистический анализ прошедших выборов в Мосгордуму. Особенно мне понравилася вот этот график зависимости голосования за партии и явки. Тут сразу видно в пользу кого был вброс.

 
Но я пошел еще дальше. Я собрал данные вообще по всем участкам (да, их более трех тысяч) . И тут корреляция видна вобщем-то не хуже. Что такое корреляция 0,41 между явкой и голосованием за ЕдРо можно продемонстрировать и так. Я  подсчитал суммарные данные по 146 участкам, где явка составила менее 20%, то есть там где вбросов не было или же они были совсем минимальны. Результаты такие:
Единая Россия 46,4% 
КПРФ 21,0%
ЛДПР 9,8%
Яблоко 8,3%
Справедливая Россия 8,0%
Патриоты 3,1%
Вполне допускаю, что это достаточно продвинутые участки, скажем, тут и МГУ и некоторые другие престижные участки (поэтому тут Яблоко даже обошло СР), поэтому там, возможно, и члены участковых комиссий менее наглые, а контроль лучше.Но тем не менее, эти участки дают нам представление о раскладе сил, если бы не было массовых вбросов за ЕР.  Вполне допускаю, что у ЕР было бы несколько больше этого. Лично я для себя, как точку отсчета, определил такие настоящие результаты этих выборов: ЕР 50%, КПРФ 20%, ЛДПР 9%, СР 8%, Яблоко 7%, Патриоты 3%. Единая Россия могла бы одержать на этих выборах победу без фальсификаций. Но вбросы были настолько значительны и настолько изменили результат выборов, что безусловно ставят под сомнение легитимность этой Думы. С другой стороны, те, кто считает что на самом деле  победила бы КПРФ, или ЕдРо набрало бы совсем мало, тоже  живут явно на "другой планете".

Date: 2009-10-14 11:16 pm (UTC)
From: [identity profile] trashcom.livejournal.com
"Следы мухлежа будут всегда". Никто ещё не видел мухлежа без следов, ибо такой мухляж нельзя увидеть )
имхо, весьма интересное упражнение, посчитать с каким распределением нужно вбрасывать, чтобы не порвать статистику

Date: 2009-10-15 12:51 am (UTC)
From: [identity profile] gomberg.livejournal.com
Не справитесь :) Человеку очень плохо даются реально "случайные" числа. Да, конечно, картинки подобной этой не будет, придется вылавливать по аномалиям в незначимых цифрах после запятой или еще по чему-то столь же эзотерическому. Можно, конечно, написать какую-нибудь очень умную программу и надеяться, что она все предусмотрит, но вряд ли оно стоит выделки. Отличить разум от неразумного случайного процесса можно практически всегда - это даже когда все под контролем. А тут ведь еще и не все под контролем: пока что есть еще участки, где въедливые наблюдатели устраивают скандалы и которые проще оставить в покое. Ну, т.е., можно, наверно, взять официальные результаты где-нибудь в Вашингтоне (где 92% честно проголосовали за Обаму) и преподнести как свои - так ведь какой-нибудь зануда, вроде автора этого журнала, цифры в лицо узнает :)))

Да и нахрен оно не нужно тем кто этим занимается. Пока власть сильна, никакие статистические данные ей не угрожают. Умеренная степень нахальства тут даже полезна: чтоб боялись. А когда она ослабеет, то о том, что выборы сфальсифицировали уж слишком сильно мы раньше узнаем не из статистических данных, а из наблюдения эмпирического факта битья окон.

Date: 2009-10-15 01:56 am (UTC)
From: [identity profile] trashcom.livejournal.com
"Человеку очень плохо даются реально "случайные" числа."
на выходе я хочу получить детерминированную функцию, которая мне скажет сколько надо класть за ЕР, сколько за КПРФ, итд, чтобы не заскрюапить статистику. ничего случайного.

Date: 2009-10-15 02:30 am (UTC)
From: [identity profile] gomberg.livejournal.com
Ну вот и зарубите. С вероятностью неотличимой от 100%. Вы поймаете те параметры, которые зададите, но всех параметров вы не зададите никогда, слишком их много. Собственно говоря, так оно и в этот раз произошло: в прошлый раз их поймали на концентрациях результатов кратных 5%. В этот раз они этого избежали. Но ничего страшного - поймались на чем-то еще. В описаном мной примере (не выборном) задача была ссимулировать случайную последовательность типа 10100010000011111100000100101110011010. Симулянты были люди грамотные и знали, что человеку свойственно слишком часто менять единицы на нули 101011010010101 - в природе такого не бывает. У них все, вцелом, в этом оказалось, на вид, чисто: они данные подогнали под известные стандартные параметры. Поймали их на том, что они вначале переборщили с компенсацией этой человеческой особенности, а потом подгоняли в конце последовательности под правильные средние результаты. В нашем случае можно, например, учитывать порядок публикации результатов и получить нетривиальные и неправдоподобные зависимости от него :) Можно смотреть на распределение частоты сотых долей процента - есть классические следы мухлежа на них.

Если вы генерируете нечестно большой набор цифр, чего-то зарубите наверняка. Не в корреляции так в распределении. Не в среднем, так в вариации. А если будете уж слишком сильно подгонять под известные честные результаты, так подгоните и под какую-нибудь их настоящую особенность, в России отсутствующую (специалист по той стране, которую вы взяли за эталон найдет сходство с какой-нибудь необычностью, которую он пол жизни длля своей Фингалии объяснял, и заинтересуется, откуда в России такое же). Естественно, внимательно искать будут только потому что подозревают. Индусов никому и в голову не приходит проверять: там Избирком вне подозрений. Ну так они заслужили.

Впрочем, власти тут вполне достойные народа. Я как-то раз говорил с коллегой из одной не очень высокоразвитой страны (беднее Индии). Он хотел провести сравнительное исследование восприятия коррупции в России и заказал опрос какой-то из российских социологических компаний. Вобщем, он их как-то так и поймал: не опрашивали они, данные придумали из офиса не выходя. Практическое исследование коррупции получилось славное, жаль не опубликуешь.

Date: 2009-10-15 02:39 am (UTC)
From: [identity profile] trashcom.livejournal.com
В описаном мной примере (не выборном) задача была ссимулировать случайную последовательность типа 10100010000011111100000100101110011010. Симулянты были люди грамотные и знали, что человеку свойственно слишком часто менять единицы на нули 101011010010101 - в природе такого не бывает.

надо было сгенерить белый шум и они с этим не справились?

Date: 2009-10-15 04:20 pm (UTC)
From: [identity profile] gomberg.livejournal.com
Им нужно было, чтобы получился белый шум. Подозреваю, что часть данных были правдой, но не были белым шумом. Они "подправили", но не сделали с нуля. Сгенерить белый шум, там где не все под полным контролем очень сложно. Ну так нынешние выборы - тот самый случай.

February 2026

S M T W T F S
1234567
891011 121314
15161718192021
22232425262728

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Feb. 27th, 2026 01:57 am
Powered by Dreamwidth Studios