Анализ результатов выборов в Мосгордуму
Oct. 12th, 2009 10:49 amХороший статистический анализ прошедших выборов в Мосгордуму. Особенно мне понравилася вот этот график зависимости голосования за партии и явки. Тут сразу видно в пользу кого был вброс.
Но я пошел еще дальше. Я собрал данные вообще по всем участкам (да, их более трех тысяч) . И тут корреляция видна вобщем-то не хуже. Что такое корреляция 0,41 между явкой и голосованием за ЕдРо можно продемонстрировать и так. Я подсчитал суммарные данные по 146 участкам, где явка составила менее 20%, то есть там где вбросов не было или же они были совсем минимальны. Результаты такие:
Единая Россия 46,4%
КПРФ 21,0%
ЛДПР 9,8%
Яблоко 8,3%
Справедливая Россия 8,0%
Патриоты 3,1%
Вполне допускаю, что это достаточно продвинутые участки, скажем, тут и МГУ и некоторые другие престижные участки (поэтому тут Яблоко даже обошло СР), поэтому там, возможно, и члены участковых комиссий менее наглые, а контроль лучше.Но тем не менее, эти участки дают нам представление о раскладе сил, если бы не было массовых вбросов за ЕР. Вполне допускаю, что у ЕР было бы несколько больше этого. Лично я для себя, как точку отсчета, определил такие настоящие результаты этих выборов: ЕР 50%, КПРФ 20%, ЛДПР 9%, СР 8%, Яблоко 7%, Патриоты 3%. Единая Россия могла бы одержать на этих выборах победу без фальсификаций. Но вбросы были настолько значительны и настолько изменили результат выборов, что безусловно ставят под сомнение легитимность этой Думы. С другой стороны, те, кто считает что на самом деле победила бы КПРФ, или ЕдРо набрало бы совсем мало, тоже живут явно на "другой планете".

Но я пошел еще дальше. Я собрал данные вообще по всем участкам (да, их более трех тысяч) . И тут корреляция видна вобщем-то не хуже. Что такое корреляция 0,41 между явкой и голосованием за ЕдРо можно продемонстрировать и так. Я подсчитал суммарные данные по 146 участкам, где явка составила менее 20%, то есть там где вбросов не было или же они были совсем минимальны. Результаты такие:
Единая Россия 46,4%
КПРФ 21,0%
ЛДПР 9,8%
Яблоко 8,3%
Справедливая Россия 8,0%
Патриоты 3,1%
Вполне допускаю, что это достаточно продвинутые участки, скажем, тут и МГУ и некоторые другие престижные участки (поэтому тут Яблоко даже обошло СР), поэтому там, возможно, и члены участковых комиссий менее наглые, а контроль лучше.Но тем не менее, эти участки дают нам представление о раскладе сил, если бы не было массовых вбросов за ЕР. Вполне допускаю, что у ЕР было бы несколько больше этого. Лично я для себя, как точку отсчета, определил такие настоящие результаты этих выборов: ЕР 50%, КПРФ 20%, ЛДПР 9%, СР 8%, Яблоко 7%, Патриоты 3%. Единая Россия могла бы одержать на этих выборах победу без фальсификаций. Но вбросы были настолько значительны и настолько изменили результат выборов, что безусловно ставят под сомнение легитимность этой Думы. С другой стороны, те, кто считает что на самом деле победила бы КПРФ, или ЕдРо набрало бы совсем мало, тоже живут явно на "другой планете".

no subject
Date: 2009-10-13 06:05 pm (UTC)(кстати, и t-test тоже ничего не доказывает. он лишь опровергает или не опровергает)
no subject
Date: 2009-10-13 06:20 pm (UTC)no subject
Date: 2009-10-13 06:23 pm (UTC)только у нас её нет
no subject
Date: 2009-10-13 06:25 pm (UTC)no subject
Date: 2009-10-13 06:29 pm (UTC)no subject
Date: 2009-10-13 06:35 pm (UTC)no subject
Date: 2009-10-13 06:45 pm (UTC)корреляция между явкой и процентом голосовавших за едро ни о чём вообще не говорит.
например, "политическая активность" фанатов ЕР просто может быть выше.
no subject
Date: 2009-10-13 07:25 pm (UTC)no subject
Date: 2009-10-13 08:10 pm (UTC)-обвинения
-то, что было в прошлый раз
-неправдоподобность
что имеет значения:
-доказательства вбросов
если таковые есть, то зачем все эти графики?
no subject
Date: 2009-10-13 08:18 pm (UTC)no subject
Date: 2009-10-13 06:40 pm (UTC)мы знаем, что отравленные огурцы в группе ели, но не знаем кто именно. И оперируя статистикой смертности доказываем связь смертей с отравленными огурцами
no subject
Date: 2009-10-13 07:26 pm (UTC)no subject
Date: 2009-10-13 08:10 pm (UTC)если нет, то см выше
no subject
Date: 2009-10-13 08:15 pm (UTC)no subject
Date: 2009-10-13 08:27 pm (UTC)логика такая (поправьте, если я не прав):
зафиксированны вбросы (есть доказательства) и прочая нечисть на каком-то количестве участков. выдвигается гипотеза, что это беззаконие творится повсеместно, делается статистический тест, который эту гипотезу не отвергает.
так?
no subject
Date: 2009-10-13 08:37 pm (UTC)no subject
Date: 2009-10-13 08:53 pm (UTC)no subject
Date: 2009-10-13 09:00 pm (UTC)no subject
Date: 2009-10-13 09:07 pm (UTC)Statistical hypothesis testing, which involves a number of steps, is used to decide whether the data contradicts the null hypothesis. This is called significance testing. A null hypothesis is never proven by such methods, as the absence of evidence against the null hypothesis does not establish its truth. In other words, one may either reject, or not reject the null hypothesis; one cannot accept it.
Статистическая проверка гипотезы, включающая несколько этапов, используется для выяснения, противоречат ли данные гипотизе. Это называется проверка на значимость. Нуль-гипотезу нельзя доказать таким методом, ибо отсутствие данных против гипотезы не устанавливает её правдивость. Другими словами, можно либо отвергнуть, либо не отвергнуть нуль-гипотезу, но никак не принять её.
no subject
Date: 2009-10-14 02:44 am (UTC)Вчера у меня болела голова и я принял аспирин. Головная боль прошла, и, насколько я знаю, медицинские статистические исследования показывают, что прием аспирина снимает головную боль. Некоторые врачи утверждают, что существует некий химический механизм действия аспирина. Однако, как известно каждому приверженцу богини Афины, снимать головную боль может только она. Таким образом, статистические исследования медиков могут быть объяснены тем, что принятие аспирина является жертвой угодной богине и помогает привлечь ее внимание к недугу.
Надеюсь вы не станете спорить с тем, что "чисто статистически" химическая и афинофильская теории, в данном случае, неразличимы? Безусловно, врачи будут настаивать на первой, а мы (афинофилы) на второй: она ведь так просто объясняет имеющиеся данные, не правда ли?
(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2009-10-13 09:09 pm (UTC)no subject
Date: 2009-10-13 09:11 pm (UTC)no subject
Date: 2009-10-14 09:29 am (UTC)Снимаю шляпу за спокойствие у обоих спорщиков.
no subject
Date: 2009-10-14 02:33 am (UTC)Корреляции никак ничего не доказывают. Они только подсказывают, где искать. Любая корреляция чем-то вызвана. Может быть, просто так карты легли (но тогда и контрольные группы не помогут - может быть, что все поедатели огурцов померли чисто случайно? может быть, все может быть). В случае с графиком про лимоны оно довольно вероятно - точек мало. В случае с графиком в этом посте оно крайне маловероятно. Да, конечно, нужно провести формальную проверку гипотезы (хоть простенькую OLS и посчитать confidence intervals) - но, вобщем, даже просто глядя на график очевидно, что гипотезу о том, что явка и голосование за ЕР несвязаны мы сможем отвергнуть с вероятностью, где-нибудь, 99.9%
Однако даже это не есть "доказательство" конкретной теории причинно-следственной связи. Формально возможно, например, что высокая популярность ЕР и вызывала повышеную явку. Чтобы проверить так ли это потребовалось бы что-нибудь более sophisticated. Тут цитировали уже википедию - вот вам ссылочка насчет IV
http://en.wikipedia.org/wiki/Instrumental_variable
Т.е., надо найти нечто, с явкой коррелирующее, а с голосами за ЕР напрямую нет. Например, можно было бы посмотреть на географическое расположение участков и посчитать среднее расстояние от домов до мест голосования. Тогда у нас был бы инструмент, позволяющий выяснить что вызвало чего: явка число голосов за ЕР или наоборот. Да, безусловно, здесь это не сделано.
Но даже если оно и сделано и показано, что большая явка вызывает повышеное голосование за ЕР, то все равно "доказательства" именно вброса нет. Чисто статистически "доказать" нельзя вообще ничего. С этой точки зрения вполне возможно, что аспирин не имеет болеутоляющего действия, но принятие его является жертвой угодной Афине, а уж богиня может (если совершить жертву) и боль снять. Так же, вообще говоря, возможно что повышеная явка отражает повышеную сознательность граждан, а повышеная сознательность, как все мы знаем, вызывает и повышеную популярность ЕР. На имеющихся данных различить эти две гипотезы невозможно. Т.е., формально ваш оппонент прав.
По сути: если он в это сам верит, я готов продать ему бруклинский мост :) Вобщем, если бы я ничего не знал об этих выборах, я бы сказал, что надо искать подтасовки и крайне бы удивился, их не найдя. Таких картинок, по опыту, в "эталонных" ситуациях не бывает, но они бывают при мухлеже. Политическая ситуация в России должна быть уж очень уникальной, чтобы такие картинки появились честно. Другой вопрос, что формально методологически он прав: корреляция - и даже формальная проверка гипотезы - тут ничего не "доказывает", а только подсказывает, где и чего искать. "Доказательством" в этом смысле может быть только поимка за руку. Все, что мы можем сказать, это то, что статистически появление такой корреляции почти наверняка не случайно, что она могла бы быть вызвана "вбросом", и что адекватных альтернативных теорий возникновения такой корреляции нам с вами неизвестно (но, увы, понятие адекватности субъективно - с точки зрения поклонников Афины неадекватна именно теория, что какой-то там порошок может без вмешательства богини помочь при головной боли).
no subject
Date: 2009-10-14 11:02 am (UTC)