kireev: (Default)
[personal profile] kireev
Хороший статистический анализ прошедших выборов в Мосгордуму. Особенно мне понравилася вот этот график зависимости голосования за партии и явки. Тут сразу видно в пользу кого был вброс.

 
Но я пошел еще дальше. Я собрал данные вообще по всем участкам (да, их более трех тысяч) . И тут корреляция видна вобщем-то не хуже. Что такое корреляция 0,41 между явкой и голосованием за ЕдРо можно продемонстрировать и так. Я  подсчитал суммарные данные по 146 участкам, где явка составила менее 20%, то есть там где вбросов не было или же они были совсем минимальны. Результаты такие:
Единая Россия 46,4% 
КПРФ 21,0%
ЛДПР 9,8%
Яблоко 8,3%
Справедливая Россия 8,0%
Патриоты 3,1%
Вполне допускаю, что это достаточно продвинутые участки, скажем, тут и МГУ и некоторые другие престижные участки (поэтому тут Яблоко даже обошло СР), поэтому там, возможно, и члены участковых комиссий менее наглые, а контроль лучше.Но тем не менее, эти участки дают нам представление о раскладе сил, если бы не было массовых вбросов за ЕР.  Вполне допускаю, что у ЕР было бы несколько больше этого. Лично я для себя, как точку отсчета, определил такие настоящие результаты этих выборов: ЕР 50%, КПРФ 20%, ЛДПР 9%, СР 8%, Яблоко 7%, Патриоты 3%. Единая Россия могла бы одержать на этих выборах победу без фальсификаций. Но вбросы были настолько значительны и настолько изменили результат выборов, что безусловно ставят под сомнение легитимность этой Думы. С другой стороны, те, кто считает что на самом деле  победила бы КПРФ, или ЕдРо набрало бы совсем мало, тоже  живут явно на "другой планете".

Date: 2009-10-13 08:27 pm (UTC)
From: [identity profile] trashcom.livejournal.com
данных о вбросах нет ни на одном из графиков, не так ли? там явка vs процент за ер.
логика такая (поправьте, если я не прав):
зафиксированны вбросы (есть доказательства) и прочая нечисть на каком-то количестве участков. выдвигается гипотеза, что это беззаконие творится повсеместно, делается статистический тест, который эту гипотезу не отвергает.
так?

Date: 2009-10-13 08:37 pm (UTC)
From: [identity profile] kireev.livejournal.com
... и делается тест, которые эти данные подтверждает. И все эти данные подтверждаются и дикими несоответсвиями с явкой и голосованием за ЕР на прошлых выборах. Все говорит за вбросы. Это все серия взаимоподтверждающих данных.

Date: 2009-10-13 08:53 pm (UTC)
From: [identity profile] trashcom.livejournal.com
на всякий случай: я не оспариваю сам факт вбросов. (это действительно, не очень разумно). Мне интересна роль статистики в этом вопросе. Насколько я понимаю, любые статистические тесты либо отвергают, либо не отвергают гипотезу. Нет теста, который подтверждает гипотезу.

Date: 2009-10-13 09:00 pm (UTC)
From: [identity profile] kireev.livejournal.com
Впервые слышу о таком. Если выбирать между двумя гипотезами: фальсификации были и фальсификации не были, эта статистика безусловно говорит в пользу первой.

Date: 2009-10-13 09:07 pm (UTC)
From: [identity profile] trashcom.livejournal.com
http://en.wikipedia.org/wiki/Null_hypothesis

Statistical hypothesis testing, which involves a number of steps, is used to decide whether the data contradicts the null hypothesis. This is called significance testing. A null hypothesis is never proven by such methods, as the absence of evidence against the null hypothesis does not establish its truth. In other words, one may either reject, or not reject the null hypothesis; one cannot accept it.

Статистическая проверка гипотезы, включающая несколько этапов, используется для выяснения, противоречат ли данные гипотизе. Это называется проверка на значимость. Нуль-гипотезу нельзя доказать таким методом, ибо отсутствие данных против гипотезы не устанавливает её правдивость. Другими словами, можно либо отвергнуть, либо не отвергнуть нуль-гипотезу, но никак не принять её.

Date: 2009-10-14 02:44 am (UTC)
From: [identity profile] gomberg.livejournal.com
True enough.

Вчера у меня болела голова и я принял аспирин. Головная боль прошла, и, насколько я знаю, медицинские статистические исследования показывают, что прием аспирина снимает головную боль. Некоторые врачи утверждают, что существует некий химический механизм действия аспирина. Однако, как известно каждому приверженцу богини Афины, снимать головную боль может только она. Таким образом, статистические исследования медиков могут быть объяснены тем, что принятие аспирина является жертвой угодной богине и помогает привлечь ее внимание к недугу.

Надеюсь вы не станете спорить с тем, что "чисто статистически" химическая и афинофильская теории, в данном случае, неразличимы? Безусловно, врачи будут настаивать на первой, а мы (афинофилы) на второй: она ведь так просто объясняет имеющиеся данные, не правда ли?

Date: 2009-10-14 04:27 am (UTC)
From: [identity profile] trashcom.livejournal.com
ну, в случае с аспирином всё достаточно просто. были клинические испытыная, людей с больными головами делили на 2 группы: одни жрали плацебо, другие - асперинчег.
нуль-гипотеза, что от аспирина нету толка опровергается данными из второй группы. в этом всё фишка научных исследований, что должна быть контрольная группа.

Date: 2009-10-14 05:43 am (UTC)
From: [identity profile] gomberg.livejournal.com
А я и не утверждал, что между аспирином и головной болью нет связи: меня устраивают вероятностные утверждения, и с вероятностью 99% я спорить не буду. Я просто постулировал альтернативную гипотезу, что связь эта идет не через биохимические процессы (в которых я понимаю, как свинья в фуа гра), а посредством прямого вмешательства воинственной дочери Зевса. Исследования с плацебо эту гипотезу опровергнуть не могут: богиня не дура и плацебо от нравящегося ей аспирина отличит, жертву не примет и помогать не будет. Попробуйте теперь найти подходящую контрольную группу, чтобы мою гипотезу опровергнуть :)

В нашем случае тут тоже вполне себе отвергается нуль-гипотеза, что явка и голосование за ЕР вообще не связаны. Ее можно отвергнуть, почти наверняка (сам статистический анализ не проводил, но на глазок) с вероятностью процентов 99. Наличие контрольной группы вам даст только тоже самое: вероятность, что таков результат случаен (что у принимавших аспирин голова не болела, а у не принимавших - болела) всегда будет (при подкидывании монетки 100 раз с положительной вероятностью все 100 раз абсолютно честно будет решка). Другой вопрос, что эта вероятность ничтожна - ну так она ничтожна в обоих примерах, и с аспирином и плацебо, и с голосованием. Это все та же самая статистика, роль контрольной группы тут играют участки с низкой явкой. Да, естественно, если бы не было вариации в явке, то сказать было бы ничего нельзя: но тут вариация есть. Да, это не лаборатория, контролируется тут меньше, поэтому исследования менее точные, требуют большего числа данных (здесь их достаточно) и, на самом деле, более сложных статистических методов (просто подсчет корреляций, конечно, не дело; здесь правда, на самом деле результаты регрессии даны, но, вообще говоря, надо хотя бы confidence intervals рассчитывать, но оно тут настолько очевидно, что простим неряшливость), но принципиальной разницы тут нет. Исследования с лабораторным контролем, в конечном итоге, дают точно такие же статистические утверждения, что и здесь.

Безусловно, отсутствие лабораторного контроля делает более сложным определение причинно-следственной связи (хотя и тут есть методы, я там в соседней подветке ссылку дал), но сам факт неслучайности связи (без ее направления) тут можно считать установленым с очень высокой вероятностью (в отличие от случайной корреляции на 6 точках в приведенном вами графике). Да, интерпретация лабораторных результатов, как правило, проще (я и сам предпочитаю лабораторные эксперименты с контролем), но тот факт, что что астрономы не могут, в отличие от просто физиков, загнать своих подследственных в лабораторию и потушить на пару минут Альдебаран, не делает астрофизику лженаукой.

"Доказать" именно "вброс" никакому статистическому анализу не под силу. Вброс это, конечно, только теория - но теория, объясняющая данные очень неплохо. Хотя, конечно, вполне возможно, что данные, на самом деле, сгенерированы волей Перуна.

Date: 2009-10-14 08:16 am (UTC)
From: [identity profile] trashcom.livejournal.com
на определенном уровне абстракции нас мало волнует, почему после приёма аспирина перестаёт болеть голова. Мне, как потребителю, пофиг, например. Производителю аспирина, тоже, я думаю, по барабану. Главное в нашем эксперименте:
1) человек принял аспирин(плацебо, ничего) до того, как у него прошла голова
2) процент излечения в основной группе значительно выше, чем в контрольных

Из данных о выборах можно сделать вывод, что большая корреляция между явкой и голосами за ЕР вряд ли случайна. Вот и всё. Может ЕР целенаправленно агитировала тех, кто вообще не хотел идти? А может ЕР агитировала в районах, где ожидалась большая явка?
И тут ещё один нюанс: даже если корреляции не было бы, это не опровергало бы модель вброса. Просто вброс в этом случае был бы умным, с учётом предполагаемого распределения.

Date: 2009-10-14 01:10 pm (UTC)
From: [identity profile] gomberg.livejournal.com
Вы абсолютно - и абсолютно тривиально - правы. С этим-то никто не спорит: доказательства причинно-следственной связи корреляции не дают (хотя, IV тут помогут). Но в сочитании со всем прочим известным они очень на что-то намекают: где искать подсказывают. Железно мы тут ничего сказать не можем, но по совокупности оно вполне beyond reasonable doubt (reasonability is, obviously, subjective).

Ну а так, я с вами соглашусь. На определеном уровне кому-то оно по барабану:

1) там где выше явка - больше голосов у ЕР
2) ЕР Думу контролирует.

А уж почему так - Перун его знает :)

Date: 2009-10-14 03:56 pm (UTC)
From: [identity profile] trashcom.livejournal.com
единственное, что я хотел сказать, статистика -- это не аргумент. это хинт, но для узкого круга людей, к примеру, следователей.
для обвинения -- это не аргумент. для возбуждения дела -- это тоже не аргумент, все эти жалобы на вбросы и фальсификации подаются кпрф-ом и ко уже который год.
единственное, для чего годятся эти графики, так это возбуждать сетевое сообщество. проблема в том, что статистикой легко манипулировать, а значит и теми, кто не знает азов этой статистики. и всё, к чему я призваю, это относится критически к импликациям, типа "корреляция => вброс"


Date: 2009-10-14 06:05 pm (UTC)
From: [identity profile] gomberg.livejournal.com
Я не юрист, поэтому, наверно, термины использую неверно. Для возбуждения дела, наверно, статистических улик недостаточно. Для проведения неких следственных действий - более чем. Учитывая массовость элеекторального процесса, то это не для узкого круга людей, а вполне для широкого. Информация сродни тому, что в городе Н. стали массово пропадать люди. Нет, трупов не находили. Но хорошо бы двери запирать всем.

Date: 2009-10-14 01:23 pm (UTC)
From: [identity profile] sir66.livejournal.com
Статистически достоверный вброс сделать довольно сложно, почти невозможно. Во первых, уровень лояльности различных избирательных участков одной партии будет всегда различный. Где то все свои, где-то только некоторые, будут совсем неудобные участки на которых много дотошных наблюдателей от других партий так что вообще ничего не сделаешь и так далее. Во вторых, правильный размер вброса зависит от явки, а это значит, что вбрасывать нужно или постепенно постоянно следя за количеством или в самом конце. Просто вбросить один раз пачку поймав удобный момент кода все нежелательные свидетели ну например на обед ушли уже не получается. Тут правда можно просто тупо ориентироваться на прогноз.

В общем, получается, что если вброс делать уши из статистики наверняка вылезут ;)

Хотя конечно, строго однозначных выводов на основании только статистики сделать нельзя. Если например предположить, что все кто не ходит на выборы всем довольны посему если уж по каким то причинам мы их выманиваем на избирательный участок они голосуют за правящую партию - будет строго та же картина.

Date: 2009-10-14 03:46 pm (UTC)
From: [identity profile] trashcom.livejournal.com
я не знаю, что такое статистический достоверный вброс, т.к. не знаю, какие свойства должны быть у статитстики честных выборов.
но, имхо, сделать полученную корреляцию недостоверной реально. вопрос, сколько бы при этом получила ЕР, ну и вообще, куча вопросов. кстати, задача интересная сама по себе.
кстати, Вы натолкнули меня на мысль:
сделать закон, что тот, кто не пошёл на выборы без уважительной причины -- автоматически голосует за правящую партию. типа, раз ты молчишь - значит всё ок.

Date: 2009-10-14 03:58 pm (UTC)
From: [identity profile] sir66.livejournal.com
Ну по крайней мере отсутствие кореляции явка- процент голосующих за партию для всех партий.

С законом - это будет не правильно, мало ли почему человек не пришел, в жизни всякое бывает. Предположение, что все кто не голосует за правящую партию вообще говоря не подтверждается. Самый сильный аргумент - данные различных опросов, они как правило, показывают рейтинги более менее сходные с результатами партий на выборах. А люди там выбираются по случайному принципу. Если бы все кто не голосует были бы за правящую партию она бы имела в опросах радикально больший рейтинг.

Date: 2009-10-14 04:08 pm (UTC)
From: [identity profile] trashcom.livejournal.com
а мы не предполагаем. мы постулируем: все кто не пришёл, голосовал за ЕР и корреляция на совести граждан. в принципе, так оно сейчас и есть, ибо если бы люди пришли, вбросить было бы сложнее. но если принять этот закон, всё было бы легально, а значит меньше криков, споров и несогласий. и экономия на исках итд

Date: 2009-10-14 05:39 pm (UTC)
From: [identity profile] sir66.livejournal.com
Логика понятна, но это перебор. Я бы скорее предложил тогда ввести обязательное голосование. Но тут есть нюанс - вброс это вообще говоря преступление. Такое же как например подмена одних биллютеней другими (а в суму его пустую кладут грамоту другую, классика). Да, махинации усложнятся, но альтерантивные методы подтасовки не отменяются. Те кто мог подтасовать одним способом подтасуют и другим. Нужны другие подходы в принципе исключающие подтасовку.

Date: 2009-10-14 05:50 pm (UTC)
From: [identity profile] abba65.livejournal.com
Тогда проще постулировать другой закон: ЕР - правящая партия навсегда, выборы (даже такие, как 11.10) не проводить!
если принять этот закон, всё было бы легально, а значит меньше криков, споров и несогласий. и экономия на исках итд

Собственно, можно и на этом не останавливаться: постулировать, скажем, личное бессмертие Путина и его пожизненное (т.е. вечное) назначение на пост Царя всея РФ. Или Бога.

С легитимностью тоже проблем никаких.
Проблема, как обычно - с реальностью...

Date: 2009-10-14 10:37 pm (UTC)
From: [identity profile] gomberg.livejournal.com
Следы мухлежа будут всегда: хорошая халтура плохо получается даже у профессионалов. Вспоминается случай (из совсем другой, невыборной, оперы - это небольшой профессиональный полускандал), когда все статистические огрехи вцелом по базе данных были учтены и не ловились, все статистики выглядели нормально. Но это только по базе вцелом. А вот если ее поделить пополам все выглядело стандартно ужасно. Другой вопрос, что для этого кому-то должно было прийти в голову посмотреть с пристрастием. В том конкретном случае, насколько я знаю, кое-кто из участников спьяну чего-то сболтнул. А уж дальше найти проблемы было делом техники (обойдусь без имен и конкретики, поскольку дальше статистически-обоснованых подозрений там официально пока не дошло).

Date: 2009-10-14 11:16 pm (UTC)
From: [identity profile] trashcom.livejournal.com
"Следы мухлежа будут всегда". Никто ещё не видел мухлежа без следов, ибо такой мухляж нельзя увидеть )
имхо, весьма интересное упражнение, посчитать с каким распределением нужно вбрасывать, чтобы не порвать статистику

(no subject)

From: [identity profile] gomberg.livejournal.com - Date: 2009-10-15 12:51 am (UTC) - Expand

(no subject)

From: [identity profile] trashcom.livejournal.com - Date: 2009-10-15 01:56 am (UTC) - Expand

(no subject)

From: [identity profile] gomberg.livejournal.com - Date: 2009-10-15 02:30 am (UTC) - Expand

(no subject)

From: [identity profile] trashcom.livejournal.com - Date: 2009-10-15 02:39 am (UTC) - Expand

(no subject)

From: [identity profile] gomberg.livejournal.com - Date: 2009-10-15 04:20 pm (UTC) - Expand

Date: 2009-10-13 09:09 pm (UTC)
From: [identity profile] trashcom.livejournal.com
спасибо за участие в споре

Date: 2009-10-13 09:11 pm (UTC)
From: [identity profile] kireev.livejournal.com
Пожалуйста.

Date: 2009-10-14 09:29 am (UTC)
From: [identity profile] pagurian.livejournal.com
Спасибо за спор! Наконец-то поставил мою крышу на место.
Снимаю шляпу за спокойствие у обоих спорщиков.

Date: 2009-10-14 02:33 am (UTC)
From: [identity profile] gomberg.livejournal.com
Безусловно, формально ваш оппонент прав. А по сути, издевается :))

Корреляции никак ничего не доказывают. Они только подсказывают, где искать. Любая корреляция чем-то вызвана. Может быть, просто так карты легли (но тогда и контрольные группы не помогут - может быть, что все поедатели огурцов померли чисто случайно? может быть, все может быть). В случае с графиком про лимоны оно довольно вероятно - точек мало. В случае с графиком в этом посте оно крайне маловероятно. Да, конечно, нужно провести формальную проверку гипотезы (хоть простенькую OLS и посчитать confidence intervals) - но, вобщем, даже просто глядя на график очевидно, что гипотезу о том, что явка и голосование за ЕР несвязаны мы сможем отвергнуть с вероятностью, где-нибудь, 99.9%

Однако даже это не есть "доказательство" конкретной теории причинно-следственной связи. Формально возможно, например, что высокая популярность ЕР и вызывала повышеную явку. Чтобы проверить так ли это потребовалось бы что-нибудь более sophisticated. Тут цитировали уже википедию - вот вам ссылочка насчет IV

http://en.wikipedia.org/wiki/Instrumental_variable

Т.е., надо найти нечто, с явкой коррелирующее, а с голосами за ЕР напрямую нет. Например, можно было бы посмотреть на географическое расположение участков и посчитать среднее расстояние от домов до мест голосования. Тогда у нас был бы инструмент, позволяющий выяснить что вызвало чего: явка число голосов за ЕР или наоборот. Да, безусловно, здесь это не сделано.

Но даже если оно и сделано и показано, что большая явка вызывает повышеное голосование за ЕР, то все равно "доказательства" именно вброса нет. Чисто статистически "доказать" нельзя вообще ничего. С этой точки зрения вполне возможно, что аспирин не имеет болеутоляющего действия, но принятие его является жертвой угодной Афине, а уж богиня может (если совершить жертву) и боль снять. Так же, вообще говоря, возможно что повышеная явка отражает повышеную сознательность граждан, а повышеная сознательность, как все мы знаем, вызывает и повышеную популярность ЕР. На имеющихся данных различить эти две гипотезы невозможно. Т.е., формально ваш оппонент прав.

По сути: если он в это сам верит, я готов продать ему бруклинский мост :) Вобщем, если бы я ничего не знал об этих выборах, я бы сказал, что надо искать подтасовки и крайне бы удивился, их не найдя. Таких картинок, по опыту, в "эталонных" ситуациях не бывает, но они бывают при мухлеже. Политическая ситуация в России должна быть уж очень уникальной, чтобы такие картинки появились честно. Другой вопрос, что формально методологически он прав: корреляция - и даже формальная проверка гипотезы - тут ничего не "доказывает", а только подсказывает, где и чего искать. "Доказательством" в этом смысле может быть только поимка за руку. Все, что мы можем сказать, это то, что статистически появление такой корреляции почти наверняка не случайно, что она могла бы быть вызвана "вбросом", и что адекватных альтернативных теорий возникновения такой корреляции нам с вами неизвестно (но, увы, понятие адекватности субъективно - с точки зрения поклонников Афины неадекватна именно теория, что какой-то там порошок может без вмешательства богини помочь при головной боли).

Date: 2009-10-14 11:02 am (UTC)
From: [identity profile] kireev.livejournal.com
Ну, тут можно согласиться в том плане, что в суде корреляции действительно не пойдут как железное доказательство. Но я же на это и не претендую. Это доказательство - весьма серьезное звено в цепочке взаимопоодтверждающих доказатеьств. Хотя каждое из них может и не тянуть на стороцентное доказательство тотальной фальсификации: ну там явно фальшивые данные, не совпадающие с протоколом и лишние сотни голосов за ЕдРо, там-то кто-то из избирателей увидел, что в списке до него отметилось слишком мало избирателей, а оказалось, что чуть ли не половина проголосовала, а другой говорит, что гастарбайтеры голосовали по 62 раза, а это все, бац, и совпадает с самими результатами по Зябликово. Ну и на прошлых выборах в Мосгордуму ничего такого не было, и вдруг необъясимые рывки в явке в каких-то районах, и там же резкий рост за ЕР. Все по отдельности в суде не пройдет как доказательство тотальной фальсификации в масштабе Москвы. А все вместе у людей, которые готовы хоть что-то слышать и видеть, тем не менее, сомнений в тотальной фальсификации остаться не должно.

February 2026

S M T W T F S
1234567
891011 121314
15161718192021
22232425262728

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Feb. 26th, 2026 10:15 pm
Powered by Dreamwidth Studios