Анализ результатов выборов в Мосгордуму
Oct. 12th, 2009 10:49 amХороший статистический анализ прошедших выборов в Мосгордуму. Особенно мне понравилася вот этот график зависимости голосования за партии и явки. Тут сразу видно в пользу кого был вброс.
Но я пошел еще дальше. Я собрал данные вообще по всем участкам (да, их более трех тысяч) . И тут корреляция видна вобщем-то не хуже. Что такое корреляция 0,41 между явкой и голосованием за ЕдРо можно продемонстрировать и так. Я подсчитал суммарные данные по 146 участкам, где явка составила менее 20%, то есть там где вбросов не было или же они были совсем минимальны. Результаты такие:
Единая Россия 46,4%
КПРФ 21,0%
ЛДПР 9,8%
Яблоко 8,3%
Справедливая Россия 8,0%
Патриоты 3,1%
Вполне допускаю, что это достаточно продвинутые участки, скажем, тут и МГУ и некоторые другие престижные участки (поэтому тут Яблоко даже обошло СР), поэтому там, возможно, и члены участковых комиссий менее наглые, а контроль лучше.Но тем не менее, эти участки дают нам представление о раскладе сил, если бы не было массовых вбросов за ЕР. Вполне допускаю, что у ЕР было бы несколько больше этого. Лично я для себя, как точку отсчета, определил такие настоящие результаты этих выборов: ЕР 50%, КПРФ 20%, ЛДПР 9%, СР 8%, Яблоко 7%, Патриоты 3%. Единая Россия могла бы одержать на этих выборах победу без фальсификаций. Но вбросы были настолько значительны и настолько изменили результат выборов, что безусловно ставят под сомнение легитимность этой Думы. С другой стороны, те, кто считает что на самом деле победила бы КПРФ, или ЕдРо набрало бы совсем мало, тоже живут явно на "другой планете".

Но я пошел еще дальше. Я собрал данные вообще по всем участкам (да, их более трех тысяч) . И тут корреляция видна вобщем-то не хуже. Что такое корреляция 0,41 между явкой и голосованием за ЕдРо можно продемонстрировать и так. Я подсчитал суммарные данные по 146 участкам, где явка составила менее 20%, то есть там где вбросов не было или же они были совсем минимальны. Результаты такие:
Единая Россия 46,4%
КПРФ 21,0%
ЛДПР 9,8%
Яблоко 8,3%
Справедливая Россия 8,0%
Патриоты 3,1%
Вполне допускаю, что это достаточно продвинутые участки, скажем, тут и МГУ и некоторые другие престижные участки (поэтому тут Яблоко даже обошло СР), поэтому там, возможно, и члены участковых комиссий менее наглые, а контроль лучше.Но тем не менее, эти участки дают нам представление о раскладе сил, если бы не было массовых вбросов за ЕР. Вполне допускаю, что у ЕР было бы несколько больше этого. Лично я для себя, как точку отсчета, определил такие настоящие результаты этих выборов: ЕР 50%, КПРФ 20%, ЛДПР 9%, СР 8%, Яблоко 7%, Патриоты 3%. Единая Россия могла бы одержать на этих выборах победу без фальсификаций. Но вбросы были настолько значительны и настолько изменили результат выборов, что безусловно ставят под сомнение легитимность этой Думы. С другой стороны, те, кто считает что на самом деле победила бы КПРФ, или ЕдРо набрало бы совсем мало, тоже живут явно на "другой планете".

no subject
Date: 2009-10-14 05:43 am (UTC)В нашем случае тут тоже вполне себе отвергается нуль-гипотеза, что явка и голосование за ЕР вообще не связаны. Ее можно отвергнуть, почти наверняка (сам статистический анализ не проводил, но на глазок) с вероятностью процентов 99. Наличие контрольной группы вам даст только тоже самое: вероятность, что таков результат случаен (что у принимавших аспирин голова не болела, а у не принимавших - болела) всегда будет (при подкидывании монетки 100 раз с положительной вероятностью все 100 раз абсолютно честно будет решка). Другой вопрос, что эта вероятность ничтожна - ну так она ничтожна в обоих примерах, и с аспирином и плацебо, и с голосованием. Это все та же самая статистика, роль контрольной группы тут играют участки с низкой явкой. Да, естественно, если бы не было вариации в явке, то сказать было бы ничего нельзя: но тут вариация есть. Да, это не лаборатория, контролируется тут меньше, поэтому исследования менее точные, требуют большего числа данных (здесь их достаточно) и, на самом деле, более сложных статистических методов (просто подсчет корреляций, конечно, не дело; здесь правда, на самом деле результаты регрессии даны, но, вообще говоря, надо хотя бы confidence intervals рассчитывать, но оно тут настолько очевидно, что простим неряшливость), но принципиальной разницы тут нет. Исследования с лабораторным контролем, в конечном итоге, дают точно такие же статистические утверждения, что и здесь.
Безусловно, отсутствие лабораторного контроля делает более сложным определение причинно-следственной связи (хотя и тут есть методы, я там в соседней подветке ссылку дал), но сам факт неслучайности связи (без ее направления) тут можно считать установленым с очень высокой вероятностью (в отличие от случайной корреляции на 6 точках в приведенном вами графике). Да, интерпретация лабораторных результатов, как правило, проще (я и сам предпочитаю лабораторные эксперименты с контролем), но тот факт, что что астрономы не могут, в отличие от просто физиков, загнать своих подследственных в лабораторию и потушить на пару минут Альдебаран, не делает астрофизику лженаукой.
"Доказать" именно "вброс" никакому статистическому анализу не под силу. Вброс это, конечно, только теория - но теория, объясняющая данные очень неплохо. Хотя, конечно, вполне возможно, что данные, на самом деле, сгенерированы волей Перуна.
no subject
Date: 2009-10-14 08:16 am (UTC)1) человек принял аспирин(плацебо, ничего) до того, как у него прошла голова
2) процент излечения в основной группе значительно выше, чем в контрольных
Из данных о выборах можно сделать вывод, что большая корреляция между явкой и голосами за ЕР вряд ли случайна. Вот и всё. Может ЕР целенаправленно агитировала тех, кто вообще не хотел идти? А может ЕР агитировала в районах, где ожидалась большая явка?
И тут ещё один нюанс: даже если корреляции не было бы, это не опровергало бы модель вброса. Просто вброс в этом случае был бы умным, с учётом предполагаемого распределения.
no subject
Date: 2009-10-14 01:10 pm (UTC)Ну а так, я с вами соглашусь. На определеном уровне кому-то оно по барабану:
1) там где выше явка - больше голосов у ЕР
2) ЕР Думу контролирует.
А уж почему так - Перун его знает :)
no subject
Date: 2009-10-14 03:56 pm (UTC)для обвинения -- это не аргумент. для возбуждения дела -- это тоже не аргумент, все эти жалобы на вбросы и фальсификации подаются кпрф-ом и ко уже который год.
единственное, для чего годятся эти графики, так это возбуждать сетевое сообщество. проблема в том, что статистикой легко манипулировать, а значит и теми, кто не знает азов этой статистики. и всё, к чему я призваю, это относится критически к импликациям, типа "корреляция => вброс"
no subject
Date: 2009-10-14 06:05 pm (UTC)no subject
Date: 2009-10-14 01:23 pm (UTC)В общем, получается, что если вброс делать уши из статистики наверняка вылезут ;)
Хотя конечно, строго однозначных выводов на основании только статистики сделать нельзя. Если например предположить, что все кто не ходит на выборы всем довольны посему если уж по каким то причинам мы их выманиваем на избирательный участок они голосуют за правящую партию - будет строго та же картина.
no subject
Date: 2009-10-14 03:46 pm (UTC)но, имхо, сделать полученную корреляцию недостоверной реально. вопрос, сколько бы при этом получила ЕР, ну и вообще, куча вопросов. кстати, задача интересная сама по себе.
кстати, Вы натолкнули меня на мысль:
сделать закон, что тот, кто не пошёл на выборы без уважительной причины -- автоматически голосует за правящую партию. типа, раз ты молчишь - значит всё ок.
no subject
Date: 2009-10-14 03:58 pm (UTC)С законом - это будет не правильно, мало ли почему человек не пришел, в жизни всякое бывает. Предположение, что все кто не голосует за правящую партию вообще говоря не подтверждается. Самый сильный аргумент - данные различных опросов, они как правило, показывают рейтинги более менее сходные с результатами партий на выборах. А люди там выбираются по случайному принципу. Если бы все кто не голосует были бы за правящую партию она бы имела в опросах радикально больший рейтинг.
no subject
Date: 2009-10-14 04:08 pm (UTC)no subject
Date: 2009-10-14 05:39 pm (UTC)no subject
Date: 2009-10-14 05:50 pm (UTC)если принять этот закон, всё было бы легально, а значит меньше криков, споров и несогласий. и экономия на исках итд
Собственно, можно и на этом не останавливаться: постулировать, скажем, личное бессмертие Путина и его пожизненное (т.е. вечное) назначение на пост Царя всея РФ. Или Бога.
С легитимностью тоже проблем никаких.
Проблема, как обычно - с реальностью...
no subject
Date: 2009-10-14 10:37 pm (UTC)no subject
Date: 2009-10-14 11:16 pm (UTC)имхо, весьма интересное упражнение, посчитать с каким распределением нужно вбрасывать, чтобы не порвать статистику
no subject
Date: 2009-10-15 12:51 am (UTC)Да и нахрен оно не нужно тем кто этим занимается. Пока власть сильна, никакие статистические данные ей не угрожают. Умеренная степень нахальства тут даже полезна: чтоб боялись. А когда она ослабеет, то о том, что выборы сфальсифицировали уж слишком сильно мы раньше узнаем не из статистических данных, а из наблюдения эмпирического факта битья окон.
no subject
Date: 2009-10-15 01:56 am (UTC)на выходе я хочу получить детерминированную функцию, которая мне скажет сколько надо класть за ЕР, сколько за КПРФ, итд, чтобы не заскрюапить статистику. ничего случайного.
no subject
Date: 2009-10-15 02:30 am (UTC)Если вы генерируете нечестно большой набор цифр, чего-то зарубите наверняка. Не в корреляции так в распределении. Не в среднем, так в вариации. А если будете уж слишком сильно подгонять под известные честные результаты, так подгоните и под какую-нибудь их настоящую особенность, в России отсутствующую (специалист по той стране, которую вы взяли за эталон найдет сходство с какой-нибудь необычностью, которую он пол жизни длля своей Фингалии объяснял, и заинтересуется, откуда в России такое же). Естественно, внимательно искать будут только потому что подозревают. Индусов никому и в голову не приходит проверять: там Избирком вне подозрений. Ну так они заслужили.
Впрочем, власти тут вполне достойные народа. Я как-то раз говорил с коллегой из одной не очень высокоразвитой страны (беднее Индии). Он хотел провести сравнительное исследование восприятия коррупции в России и заказал опрос какой-то из российских социологических компаний. Вобщем, он их как-то так и поймал: не опрашивали они, данные придумали из офиса не выходя. Практическое исследование коррупции получилось славное, жаль не опубликуешь.
no subject
Date: 2009-10-15 02:39 am (UTC)надо было сгенерить белый шум и они с этим не справились?
no subject
Date: 2009-10-15 04:20 pm (UTC)