kireev: (Default)
[personal profile] kireev
Спасибо [livejournal.com profile] altz_gamer  за ссылку на исследование Анатолия Бондаренко о том, были ли фальсификации на президентских выборах на Украине. Вот какие результаты получились.

Первая картинка: распределение участков  по явке на президентских выборах в Польше в 2005 г. Тут совешенно нормальное распредление, никаких аномалий. В идеале график именно таким и должен быть. 


А вот картина с явными аномалиями: президентские выборы в России 2008 г. Тут мы видим, во-первых, резкий скачок участков с 100% явкой, а во-вторых, пики на круглых числах явки - 60%, 70%, 80%, 90%, ну и 100%. Любовь к круглым числам уже не раз обсуждалась, и является еще одним доказательством, что как правило фальсификаторы являются не очень умными людьми, и поймать их не так уж и сложно.
 



На Украине тоже есть скачок на 100%, но это, видимо, особенность пост-советского пространства - много всяких спец-участков. Поэтому, если убрать участки с маленьким количеством избирателей, то скачка не будет, но останется "хвостик" (зеленым показано нормальное распределение участков по явке). 



А в чью пользу эти "аномалии"? В пользу сразу двух главных кандидатов: Януковича и Тимошенко! Синим цветом тут показан Янукович, розовым - Тимошенко, а коричневым - Тигипко. У Тигипко распределение практически идеальное. Это логично: его электорат в больших городах, и на победу все же не расчитывал, и в его пользу никакого административного ресурса не было. А вот в пользу двух претендентов на победу он был.



Таким образом Бондаренко поставил под сомнение 400 тыс. голосов - почти 2% от всех. Не уверен, что все это фальсификации, но кое-где Тимошенко и Януковичу добавили, что, впрочем, сильно результат явно не изменило. Если, скажем, фальсификации на выборах в Мосгордуму можно признать тотальными, на президентских выборов 2008 в России ощутимыми, то в первом туре на Украине небольшими, а в Польше их не было. Правда, в оценке уровня фальсификаций на Украине я бы не хотел использовать слова "незначительные" или "маленье", потому что любые фальификации нуждаются в расследовании, а виновные должны быть наказаны.

Date: 2010-01-29 03:28 pm (UTC)
From: [identity profile] autar.livejournal.com
Я правильно понимаю, что основная причина этому - спецучастки? Например, исправительные колонии. Или особенно - больницы. Там включают всех, кто на день голосования в больнице находится, и явка может быть 100%, раз уж ходят с урной по палатам.
Плюс особенности поведения, например, жителей малых сел - там все обязательно голосуют, в отличие от западных стран, и выходит перекос при показателях, близких к 100%.

Date: 2010-01-29 03:30 pm (UTC)
From: [identity profile] sergey-fomichov.livejournal.com
полагаю, отклонения от кривой Гаусса свидетельствуют не об одной лишь фальсификации, а о несвободе на выборах. То есть помимо буквальной фальсификации (подделки результатов) на избирателя можно надавить разными способами.

Date: 2010-01-29 03:32 pm (UTC)
From: [identity profile] kireev.livejournal.com
Да, поэтому спец. участки и надо убирать, а это как правило все же участки с небольшим числом избирателей. Во-вторых, да, мне эти села тоже сразу же пришли в голову. Именно поэтому я не сомневаюсь, что фальсификации, если и были, то никак не 400 тысяч. Но там приличный скачок в пользу Януковича и Тимошенко. Они в селах несколько больше и набирали, но все же скачок таким сильным не должен быть, но это как минимум частично объясняет его.

Date: 2010-01-29 03:33 pm (UTC)
From: [identity profile] kireev.livejournal.com
Согласен.

Date: 2010-01-29 03:56 pm (UTC)
From: [identity profile] psilogic.livejournal.com
А почему вы посчитали, что распределение должно быть именно нормальным? Симметричная картина может быть, когда явка близка к 50%. Тогда границы интервала находятся на равном удалении от матожидания. А в данном случае там есть границы, которые неизбежно "срежут" колокол справа или слева. И какой формы должен быть тот "срез" с т. зрения статистикм?

Date: 2010-01-29 04:05 pm (UTC)
From: [identity profile] kireev.livejournal.com
Так это же неважно справа колокол или слева, ведь симметрия при этом должна сохраняться, как и показано зелеными штрихами.

Date: 2010-01-29 04:07 pm (UTC)
From: [identity profile] psilogic.livejournal.com
Вот я и спросил, почему "должно"

Идея... попробую-ка я слабать модель, в которой человек идет на избирательный участок с шансом 66% и посмотрю, какая кривая нарисуется. Какое там обычное количество избирателей на участке и число участков?

Date: 2010-01-29 04:12 pm (UTC)
From: [identity profile] kireev.livejournal.com
При нормальном распределении должно, потому что участков много тысяч, то есть просто действуют статистические закономерности.

Date: 2010-01-29 04:26 pm (UTC)
From: [identity profile] psilogic.livejournal.com
Дык, "статистические закономерности" бывают разные. Например, если суммируется 100 равномерных распределений, получается нормальное. А, если умножается 100 равномерных, то уже не нормальное.

Вот, что получилось.
Число участков 1000.
Число избирателей на каждом участке 5000 ровно.
Шанс прихода избирателя 66%.
В распределении почти все нули. Ненулевые члены:

arr[64]=62 (т.е. на 62 участках проголосовало 64%)
arr[65]=446
arr[66]=415
arr[67]=76
arr[68]=1

Очень узкий пик. Сейчас попробую варьировать размер участка...

Date: 2010-01-29 04:54 pm (UTC)
From: [identity profile] psilogic.livejournal.com
число участков = 33,000
размер участка - случайное число от 10 до 1,000
активность на участке* - случайное число от 0,42 до 0,90 (среднее 0,66)
* с этим шансом избиратель приходит на этот участок

результат моделирования довольно странный:

Image

Date: 2010-01-29 04:59 pm (UTC)
From: [identity profile] psilogic.livejournal.com
те же данные, но активность не варьируется, а постоянная - 0,66:

Image

Растянуть график так, чтобы по бокам хвосты "срезались" границами, не удается.

моделирующий код:

const int iu_count= 33000;
const int iu_size= 5000;

static int perc[101];
static int *arr;

	double chance= 0.66;
	arr= new int[iu_count];
	int i, k, j;

	for(i= 0; i < iu_count; ++i)
	{
		int sum= 0;
		int iu_sz= random(10, 1000);
		chance= 0.66;
		for(j= 0; j < iu_sz; ++j)
		{
			if (random(0.0, 1.0) < chance)
				++sum;
		}
		arr[i]= (sum * 100) / iu_sz;
	}

	for(k= 0; k <= 100; ++k)
		perc[k]= 0;
	for(i= 0; i < iu_count; ++i)
		++perc[arr[i]];

	delete [] arr;

Date: 2010-01-29 05:06 pm (UTC)
From: [identity profile] psilogic.livejournal.com
то же самое, но активность является случайной величиной, которая распределена приблизительно "нормально" на участке 0.42...0.90

Image

то же самое, но активность является случайной величиной, которая распределена приблизительно "нормально" на участке 0.00...1.32 с "обрезанием" по 1.0 (потому что активность выше 100% невозможна)

и вот тут оказывается похоже:

Image

Date: 2010-01-29 05:25 pm (UTC)
From: [identity profile] kireev.livejournal.com
А зачем в последнюю модель включать 1.32, если потом делать "обрезание"?

Date: 2010-01-29 05:26 pm (UTC)
From: [identity profile] podmoskovnik.livejournal.com
При такой модели пик действительно очень узкий, среднеквадратичное отклонение от средней явки для биномиального распределения (это оно) sqrt(p*(1-p)/N), где N - число избирателей на участке, p - вероятность явки избирателя.
Экспериментальные факты по моему опыту анализа выборов таковы:
- Ширина распределения участков по явке значительно больше, чем дает модель со случайной явкой избирателей. Видимо, гораздо больший вклад в ширину дает разброс вероятности явки от участка к участку.
- Реальное распределение участков по явке не является строго гауссовым (и не должно быть им, если подумать). В частности, края распределения сильно выше, чем у гауссова.
- Чем меньше оснований считать выборы фальсифицированными, тем распределение участков по явке симметричнее и "колоколообразнее".

Date: 2010-01-29 05:37 pm (UTC)
From: [identity profile] oude-rus.livejournal.com
я написал было, что ваш оппонент прав, и даже аргументировал, но проклятый хомяк журнал все сожрал.

не суть, вы и сами все понимаете.

Date: 2010-01-29 05:39 pm (UTC)
From: [identity profile] oude-rus.livejournal.com
У Януковича тоже довольно близко к идеалу, а вот Тимошенко расстаралась.

Date: 2010-01-29 05:42 pm (UTC)
From: [identity profile] oude-rus.livejournal.com
и ссылка, зараза, не открываевтся.

Date: 2010-01-29 06:04 pm (UTC)
From: [identity profile] kireev.livejournal.com
У меня опять-таки объяснение, что там дело частично может быть в том, что участки с почти 100% явкой могут быть больше на Западной Украине, где на селе явка выше, чем на Юго-Востоке.

Date: 2010-01-29 06:23 pm (UTC)
From: [identity profile] oude-rus.livejournal.com
ага, принимается.

в общем, консенсус здесь такой, что погешности, if any, в статистических пределах.

Date: 2010-01-29 06:38 pm (UTC)
From: [identity profile] psilogic.livejournal.com
Чтобы соблюсти два условия: сделать возможной активность 0 и сделать распределение активности симметричным относительно 0.66.

Активность на участке более 1 - это значит, что граждане пришли бы на участок в почти полном составе даже при меньшей мотивации. Но эта повышенная мотивация никак не может быть отражена, так как они не могут проголосовать дважды.

Вообще говоря, я не знаю, какая модель для активности правильная. Если посмотрите алгоритм моделирования, то там как бы каждый избиратель бросает жребий - идти на выборы или не идти. При сам бросок жребия использует некий шанс. Но какой? Для этого шанса непонятно, где взять модель.

Date: 2010-01-29 06:51 pm (UTC)
From: [identity profile] psilogic.livejournal.com
А уж скачки ровно на 5%-ных барьерах и чуть больше на 10%-ных - это вообще хоть в учебник заноси. Дисциплинированно "нарисовали" столько, сколько приказано :)

Судя по графику, на выборах 2008 только 1 из 5 участков был честным.

Исходные данные.

Date: 2010-01-29 07:47 pm (UTC)
From: [identity profile] tag-ua.livejournal.com
Доброй ночи,

А можно ли получить Excel файл с исходнимы данными?

Тайной ведь они не являются - на сайте ЦВК есть, но ради удобства - чтобы перепроверить факты...

Date: 2010-01-29 08:06 pm (UTC)
From: [identity profile] les2.livejournal.com
Я бы также ожидал не вполне симметричного распределения. Более плавного в более близкую к 50% сторону, и более крутому к более близкою к краю.

Date: 2010-01-29 08:15 pm (UTC)
From: [identity profile] les2.livejournal.com
Да нет, это скорее всего не фальсификации. Это тюрьмы, больницы.

Я вот тут данные по екзит-полам посмотрел, немножко усреднил. Получается, что три аномалии - но очень небольшие - наблюдаются. По Симоненко в +0,6% (голосование на дому?), по Тягныбоку -0,45% (непонятно), по "не підтримую жодного" -0,45% (не признаются?). По результатам Януковича и Тимошенко отклонения глубоко в рамках погрешности.

Date: 2010-01-29 09:17 pm (UTC)
From: [identity profile] kireev.livejournal.com
=Активность на участке более 1 - это значит, что граждане пришли бы на участок в почти полном составе даже при меньшей мотивации=

Что-то эту часть я вообще не понимаю. Но модель, где есть скачок к 100% явно не может быть правильной.

Date: 2010-01-29 09:20 pm (UTC)
From: [identity profile] kireev.livejournal.com
Ссылка на что? На статью или данные по участкам?

Re: Исходные данные.

Date: 2010-01-29 09:20 pm (UTC)
From: [identity profile] kireev.livejournal.com
Так ссылка же приведена на данные http://zaua.org/action/file/download?file_guid=14866

Re: Исходные данные.

Date: 2010-01-29 10:26 pm (UTC)
From: [identity profile] tag-ua.livejournal.com
Так нету номеров участков и округов там!

Плюс с сайта ЦВК убрали колонки о количестве внесенных в списки, скольким выдали бюлетни и сколько их потом в урне нашли, дате и времени подписания протокола и не исправленный ли он!

Пример когда данные играют роль = http://forum.pravda.com.ua/read.php?2,207305028

Я вынес бюлетень (домой, не карусель) - а его коммисия сдала по документам в окружную как будто ни в чем не бывало!

Date: 2010-01-29 10:41 pm (UTC)
From: [identity profile] psilogic.livejournal.com
Попробую пояснить на примерах.
Активность 0,1 - в текущей ситуации только 10% граждан придут на выборы.
Активность 0,5 - в текущей ситуации половина граждан придут на выборы.
Активность 1,0 - в текущей ситуации все граждане (окромя внезапно заболевших и т.п.) придут на выборы.
Активность 1,5 - в текущей ситуации все граждане (окромя внезапно заболевших и т.п.) придут на выборы, и также все бы пришли на выборы, если бы ситуация способствовала тому меньше, чем текущая (скажем, случился бы внезапный 35-градусный мороз).

Re: Исходные данные.

Date: 2010-01-29 11:13 pm (UTC)
From: [identity profile] kireev.livejournal.com
Ну так саму статистику же можно проверить и без номеров участков.

Date: 2010-01-29 11:29 pm (UTC)
From: [identity profile] kireev.livejournal.com
А как вообще может быть 1,5 - если это больше 100%? Я не понимаю, как эта цифра, которой не может быть в приниципе, может закладываться в модель?

Re: Исходные данные.

Date: 2010-01-29 11:55 pm (UTC)
From: [identity profile] tag-ua.livejournal.com
Можно сделать неверные выводы.

Простой пример - участок 114 округа 34. Это колония с 1480 избирателями.
Явка на ней явно что большая (чем еще там заняться). И таких участков - больших и с большой явкой - много!

Причем они смещены будет в сторону 100% явки.
Имеено той, которую по графикам показывают как 2% фальсификаций.

Вот почему очень важно видеть полные данные.

Предположение что явка случайна ошибочно. Есть систематическая ошибка выборки. А как результат и распределения не получаете идеального.

стишок в тему

Date: 2010-01-30 12:06 am (UTC)
From: [identity profile] verbo-honorado.livejournal.com
На сцене вижу я премного
Так называемых артистов.
Им несть числа, и мне, ей-богу,
Не до статистики статистов!
(А.П.Чехов)

Re: Исходные данные.

Date: 2010-01-30 12:49 am (UTC)
From: [identity profile] kireev.livejournal.com
А-а, понял. Да, я поэтому и очень сомневался, что все 400 тыс. - это фальсификации и хвостик и должен быть. Другое дело, что именно тут голосвание за двух лидеров: Тимошенко или Януковича. Но в колониях, мне сказали, голосовали за Тимошенко уверенно. А в сумме за Тимошенко и Януковича, видимо, вообще подавляющее большинство.

Date: 2010-01-30 12:54 am (UTC)
From: [identity profile] psilogic.livejournal.com
Чисто технически

chance= randomNormal(0.0, 1.32);
...
if (random(0.0, 1.0) < chance) ++sum;

т.е. для участков, где выпадает 1.0 и более, явка сто-процентная, откуда и образуется этот пик.

Date: 2010-01-30 01:08 am (UTC)
From: (Anonymous)
Посмотрите на результаты по участкам
ТВО №170, Харківська область, участок 80
ТВО №174, Харківська область, участок 45
ТВО №175, Харківська область, участок 63
ТВО №176, Харківська область, участки 94,95,96
на сайте цвк.

Явка близкая к 100% и 70-80% проголосовавших за Тимошенко в городе Харьков. При том, что в целом по городу Тимошенко взяла в районе 10%.

Если у кого-то есть возможность, было бы интересно выловить участки такого типа программно по всей стране, отсеять их, и только потом исследовать выборку.
Я предполагая, что это тюрьмы или воинские части.
Я предпо

Date: 2010-01-30 01:21 am (UTC)
From: [identity profile] kireev.livejournal.com
Нет, тут я, гуманитарий, уже пас: для меня этот пик непонятен все равно.

Date: 2010-01-30 01:37 am (UTC)
From: [identity profile] kireev.livejournal.com
ТВО №176, Харківська область, участки 94,95,96
Это колонии и изоляторы.

ТВО №174, Харківська область, участок 45
ТВО №175, Харківська область, участок 63

Эти участки - последние в списке в этих округах. Обычно последними размещаются какие-то спец. участки.

Re: стишок в тему

Date: 2010-01-30 01:39 am (UTC)
From: [identity profile] kireev.livejournal.com
В смысле, это в тему "Чехов - украинский поэт"?

Date: 2010-01-30 08:26 am (UTC)
From: [identity profile] renivid.livejournal.com
Просто не надо относиться к этому 1.32 как к вероятности. Это не вероятность, это мотивированность. И при таких условиях пик на 100% может быть. То есть какой-то набор участков, где люди "очень хотят голосовать" - намного больше чем в среднем по стране. Например, тюрьмы, психбольницы, армия и т.п. То есть там они проголосуют даже, если все кандидаты перед выборами скажут по телеку, что все избиратели - лохи :).

Re: Исходные данные.

Date: 2010-01-30 08:57 am (UTC)
From: [identity profile] tag-ua.livejournal.com
Верно. Вот ту колонию которую я показал - они за Тимошенко. В то время как округ за Януковича.

Но, не забывайте, что кроме колоний - есть спецучастки в больницах. В них явка будет не 100%, но тоже повышенная. И будет она за лидеров гонки - т.е. Януковича и Тимошенко.

Плюс есть средние участки в небольших селах. Там где все рядом. Тоже явка будет повышенной.

К сожалению данных с ЦВК полных сейчас нет - поэтому высказываю все это как предположения. Возможно в чем-то ошибочные.

К примеру моей ошибкой может быть то, что регионалы на автобусах организовывают подвоз избирателей. За счет контроля над бизнессом маршруток - можно увеличить явку в регионе.

Date: 2010-01-30 10:43 am (UTC)
From: [identity profile] kireev.livejournal.com
Да, есть такие. Правда многие из этих участков убраны из модели Бондаренко, так как там мало избирателей.

Date: 2010-01-31 05:49 am (UTC)
From: (Anonymous)
Очень интересно провести это исследование не в целом по стране, а в Донецкой, Луганской, Черниговской областях. Тех областях, где высказывались подозрения про фальсификацию.

Date: 2010-02-01 07:37 am (UTC)
From: [identity profile] podmoskovnik.livejournal.com
Вот тут похожим образом моделировали московские выборы: http://avplat.livejournal.com/1636.html

Re: Исходные данные.

Date: 2010-02-01 07:39 am (UTC)
From: [identity profile] podmoskovnik.livejournal.com
вот с номерами и численностью избирателей: http://zaua.org/action/file/download?file_guid=15016

February 2026

S M T W T F S
1234567
891011 121314
15161718192021
22232425262728

Most Popular Tags

Page Summary

Style Credit

Expand Cut Tags

No cut tags
Page generated Feb. 26th, 2026 05:10 pm
Powered by Dreamwidth Studios