Спасибо
altz_gamer за ссылку на исследование Анатолия Бондаренко о том, были ли фальсификации на президентских выборах на Украине. Вот какие результаты получились.
Первая картинка: распределение участков по явке на президентских выборах в Польше в 2005 г. Тут совешенно нормальное распредление, никаких аномалий. В идеале график именно таким и должен быть.

А в чью пользу эти "аномалии"? В пользу сразу двух главных кандидатов: Януковича и Тимошенко! Синим цветом тут показан Янукович, розовым - Тимошенко, а коричневым - Тигипко. У Тигипко распределение практически идеальное. Это логично: его электорат в больших городах, и на победу все же не расчитывал, и в его пользу никакого административного ресурса не было. А вот в пользу двух претендентов на победу он был.

Таким образом Бондаренко поставил под сомнение 400 тыс. голосов - почти 2% от всех. Не уверен, что все это фальсификации, но кое-где Тимошенко и Януковичу добавили, что, впрочем, сильно результат явно не изменило. Если, скажем, фальсификации на выборах в Мосгордуму можно признать тотальными, на президентских выборов 2008 в России ощутимыми, то в первом туре на Украине небольшими, а в Польше их не было. Правда, в оценке уровня фальсификаций на Украине я бы не хотел использовать слова "незначительные" или "маленье", потому что любые фальификации нуждаются в расследовании, а виновные должны быть наказаны.
Первая картинка: распределение участков по явке на президентских выборах в Польше в 2005 г. Тут совешенно нормальное распредление, никаких аномалий. В идеале график именно таким и должен быть.
А вот картина с явными аномалиями: президентские выборы в России 2008 г. Тут мы видим, во-первых, резкий скачок участков с 100% явкой, а во-вторых, пики на круглых числах явки - 60%, 70%, 80%, 90%, ну и 100%. Любовь к круглым числам уже не раз обсуждалась, и является еще одним доказательством, что как правило фальсификаторы являются не очень умными людьми, и поймать их не так уж и сложно.
На Украине тоже есть скачок на 100%, но это, видимо, особенность пост-советского пространства - много всяких спец-участков. Поэтому, если убрать участки с маленьким количеством избирателей, то скачка не будет, но останется "хвостик" (зеленым показано нормальное распределение участков по явке).
А в чью пользу эти "аномалии"? В пользу сразу двух главных кандидатов: Януковича и Тимошенко! Синим цветом тут показан Янукович, розовым - Тимошенко, а коричневым - Тигипко. У Тигипко распределение практически идеальное. Это логично: его электорат в больших городах, и на победу все же не расчитывал, и в его пользу никакого административного ресурса не было. А вот в пользу двух претендентов на победу он был.
Таким образом Бондаренко поставил под сомнение 400 тыс. голосов - почти 2% от всех. Не уверен, что все это фальсификации, но кое-где Тимошенко и Януковичу добавили, что, впрочем, сильно результат явно не изменило. Если, скажем, фальсификации на выборах в Мосгордуму можно признать тотальными, на президентских выборов 2008 в России ощутимыми, то в первом туре на Украине небольшими, а в Польше их не было. Правда, в оценке уровня фальсификаций на Украине я бы не хотел использовать слова "незначительные" или "маленье", потому что любые фальификации нуждаются в расследовании, а виновные должны быть наказаны.
no subject
Date: 2010-01-29 04:07 pm (UTC)Идея... попробую-ка я слабать модель, в которой человек идет на избирательный участок с шансом 66% и посмотрю, какая кривая нарисуется. Какое там обычное количество избирателей на участке и число участков?
no subject
Date: 2010-01-29 04:12 pm (UTC)no subject
Date: 2010-01-29 04:26 pm (UTC)Вот, что получилось.
Число участков 1000.
Число избирателей на каждом участке 5000 ровно.
Шанс прихода избирателя 66%.
В распределении почти все нули. Ненулевые члены:
arr[64]=62 (т.е. на 62 участках проголосовало 64%)
arr[65]=446
arr[66]=415
arr[67]=76
arr[68]=1
Очень узкий пик. Сейчас попробую варьировать размер участка...
no subject
Date: 2010-01-29 05:26 pm (UTC)Экспериментальные факты по моему опыту анализа выборов таковы:
- Ширина распределения участков по явке значительно больше, чем дает модель со случайной явкой избирателей. Видимо, гораздо больший вклад в ширину дает разброс вероятности явки от участка к участку.
- Реальное распределение участков по явке не является строго гауссовым (и не должно быть им, если подумать). В частности, края распределения сильно выше, чем у гауссова.
- Чем меньше оснований считать выборы фальсифицированными, тем распределение участков по явке симметричнее и "колоколообразнее".
no subject
Date: 2010-01-29 06:51 pm (UTC)Судя по графику, на выборах 2008 только 1 из 5 участков был честным.
no subject
Date: 2010-02-01 07:37 am (UTC)no subject
Date: 2010-01-29 04:54 pm (UTC)размер участка - случайное число от 10 до 1,000
активность на участке* - случайное число от 0,42 до 0,90 (среднее 0,66)
* с этим шансом избиратель приходит на этот участок
результат моделирования довольно странный:
no subject
Date: 2010-01-29 04:59 pm (UTC)Растянуть график так, чтобы по бокам хвосты "срезались" границами, не удается.
моделирующий код:
const int iu_count= 33000; const int iu_size= 5000; static int perc[101]; static int *arr; double chance= 0.66; arr= new int[iu_count]; int i, k, j; for(i= 0; i < iu_count; ++i) { int sum= 0; int iu_sz= random(10, 1000); chance= 0.66; for(j= 0; j < iu_sz; ++j) { if (random(0.0, 1.0) < chance) ++sum; } arr[i]= (sum * 100) / iu_sz; } for(k= 0; k <= 100; ++k) perc[k]= 0; for(i= 0; i < iu_count; ++i) ++perc[arr[i]]; delete [] arr;no subject
Date: 2010-01-29 05:06 pm (UTC)то же самое, но активность является случайной величиной, которая распределена приблизительно "нормально" на участке 0.00...1.32 с "обрезанием" по 1.0 (потому что активность выше 100% невозможна)
и вот тут оказывается похоже:
no subject
Date: 2010-01-29 05:25 pm (UTC)no subject
Date: 2010-01-29 06:38 pm (UTC)Активность на участке более 1 - это значит, что граждане пришли бы на участок в почти полном составе даже при меньшей мотивации. Но эта повышенная мотивация никак не может быть отражена, так как они не могут проголосовать дважды.
Вообще говоря, я не знаю, какая модель для активности правильная. Если посмотрите алгоритм моделирования, то там как бы каждый избиратель бросает жребий - идти на выборы или не идти. При сам бросок жребия использует некий шанс. Но какой? Для этого шанса непонятно, где взять модель.
no subject
Date: 2010-01-29 09:17 pm (UTC)Что-то эту часть я вообще не понимаю. Но модель, где есть скачок к 100% явно не может быть правильной.
no subject
Date: 2010-01-29 10:41 pm (UTC)Активность 0,1 - в текущей ситуации только 10% граждан придут на выборы.
Активность 0,5 - в текущей ситуации половина граждан придут на выборы.
Активность 1,0 - в текущей ситуации все граждане (окромя внезапно заболевших и т.п.) придут на выборы.
Активность 1,5 - в текущей ситуации все граждане (окромя внезапно заболевших и т.п.) придут на выборы, и также все бы пришли на выборы, если бы ситуация способствовала тому меньше, чем текущая (скажем, случился бы внезапный 35-градусный мороз).
no subject
Date: 2010-01-29 11:29 pm (UTC)no subject
Date: 2010-01-30 12:54 am (UTC)chance= randomNormal(0.0, 1.32);
...
if (random(0.0, 1.0) < chance) ++sum;
т.е. для участков, где выпадает 1.0 и более, явка сто-процентная, откуда и образуется этот пик.
no subject
Date: 2010-01-30 01:21 am (UTC)no subject
Date: 2010-01-30 08:26 am (UTC)no subject
Date: 2010-01-30 10:43 am (UTC)no subject
Date: 2010-01-29 05:37 pm (UTC)хомякжурнал все сожрал.не суть, вы и сами все понимаете.