kireev: (Default)
[personal profile] kireev
Спасибо [livejournal.com profile] altz_gamer  за ссылку на исследование Анатолия Бондаренко о том, были ли фальсификации на президентских выборах на Украине. Вот какие результаты получились.

Первая картинка: распределение участков  по явке на президентских выборах в Польше в 2005 г. Тут совешенно нормальное распредление, никаких аномалий. В идеале график именно таким и должен быть. 


А вот картина с явными аномалиями: президентские выборы в России 2008 г. Тут мы видим, во-первых, резкий скачок участков с 100% явкой, а во-вторых, пики на круглых числах явки - 60%, 70%, 80%, 90%, ну и 100%. Любовь к круглым числам уже не раз обсуждалась, и является еще одним доказательством, что как правило фальсификаторы являются не очень умными людьми, и поймать их не так уж и сложно.
 



На Украине тоже есть скачок на 100%, но это, видимо, особенность пост-советского пространства - много всяких спец-участков. Поэтому, если убрать участки с маленьким количеством избирателей, то скачка не будет, но останется "хвостик" (зеленым показано нормальное распределение участков по явке). 



А в чью пользу эти "аномалии"? В пользу сразу двух главных кандидатов: Януковича и Тимошенко! Синим цветом тут показан Янукович, розовым - Тимошенко, а коричневым - Тигипко. У Тигипко распределение практически идеальное. Это логично: его электорат в больших городах, и на победу все же не расчитывал, и в его пользу никакого административного ресурса не было. А вот в пользу двух претендентов на победу он был.



Таким образом Бондаренко поставил под сомнение 400 тыс. голосов - почти 2% от всех. Не уверен, что все это фальсификации, но кое-где Тимошенко и Януковичу добавили, что, впрочем, сильно результат явно не изменило. Если, скажем, фальсификации на выборах в Мосгордуму можно признать тотальными, на президентских выборов 2008 в России ощутимыми, то в первом туре на Украине небольшими, а в Польше их не было. Правда, в оценке уровня фальсификаций на Украине я бы не хотел использовать слова "незначительные" или "маленье", потому что любые фальификации нуждаются в расследовании, а виновные должны быть наказаны.

Date: 2010-01-29 03:56 pm (UTC)
From: [identity profile] psilogic.livejournal.com
А почему вы посчитали, что распределение должно быть именно нормальным? Симметричная картина может быть, когда явка близка к 50%. Тогда границы интервала находятся на равном удалении от матожидания. А в данном случае там есть границы, которые неизбежно "срежут" колокол справа или слева. И какой формы должен быть тот "срез" с т. зрения статистикм?

Date: 2010-01-29 04:05 pm (UTC)
From: [identity profile] kireev.livejournal.com
Так это же неважно справа колокол или слева, ведь симметрия при этом должна сохраняться, как и показано зелеными штрихами.

Date: 2010-01-29 04:07 pm (UTC)
From: [identity profile] psilogic.livejournal.com
Вот я и спросил, почему "должно"

Идея... попробую-ка я слабать модель, в которой человек идет на избирательный участок с шансом 66% и посмотрю, какая кривая нарисуется. Какое там обычное количество избирателей на участке и число участков?

Date: 2010-01-29 04:12 pm (UTC)
From: [identity profile] kireev.livejournal.com
При нормальном распределении должно, потому что участков много тысяч, то есть просто действуют статистические закономерности.

Date: 2010-01-29 04:26 pm (UTC)
From: [identity profile] psilogic.livejournal.com
Дык, "статистические закономерности" бывают разные. Например, если суммируется 100 равномерных распределений, получается нормальное. А, если умножается 100 равномерных, то уже не нормальное.

Вот, что получилось.
Число участков 1000.
Число избирателей на каждом участке 5000 ровно.
Шанс прихода избирателя 66%.
В распределении почти все нули. Ненулевые члены:

arr[64]=62 (т.е. на 62 участках проголосовало 64%)
arr[65]=446
arr[66]=415
arr[67]=76
arr[68]=1

Очень узкий пик. Сейчас попробую варьировать размер участка...

Date: 2010-01-29 05:26 pm (UTC)
From: [identity profile] podmoskovnik.livejournal.com
При такой модели пик действительно очень узкий, среднеквадратичное отклонение от средней явки для биномиального распределения (это оно) sqrt(p*(1-p)/N), где N - число избирателей на участке, p - вероятность явки избирателя.
Экспериментальные факты по моему опыту анализа выборов таковы:
- Ширина распределения участков по явке значительно больше, чем дает модель со случайной явкой избирателей. Видимо, гораздо больший вклад в ширину дает разброс вероятности явки от участка к участку.
- Реальное распределение участков по явке не является строго гауссовым (и не должно быть им, если подумать). В частности, края распределения сильно выше, чем у гауссова.
- Чем меньше оснований считать выборы фальсифицированными, тем распределение участков по явке симметричнее и "колоколообразнее".

Date: 2010-01-29 06:51 pm (UTC)
From: [identity profile] psilogic.livejournal.com
А уж скачки ровно на 5%-ных барьерах и чуть больше на 10%-ных - это вообще хоть в учебник заноси. Дисциплинированно "нарисовали" столько, сколько приказано :)

Судя по графику, на выборах 2008 только 1 из 5 участков был честным.

Date: 2010-02-01 07:37 am (UTC)
From: [identity profile] podmoskovnik.livejournal.com
Вот тут похожим образом моделировали московские выборы: http://avplat.livejournal.com/1636.html

Date: 2010-01-29 04:54 pm (UTC)
From: [identity profile] psilogic.livejournal.com
число участков = 33,000
размер участка - случайное число от 10 до 1,000
активность на участке* - случайное число от 0,42 до 0,90 (среднее 0,66)
* с этим шансом избиратель приходит на этот участок

результат моделирования довольно странный:

Image

Date: 2010-01-29 04:59 pm (UTC)
From: [identity profile] psilogic.livejournal.com
те же данные, но активность не варьируется, а постоянная - 0,66:

Image

Растянуть график так, чтобы по бокам хвосты "срезались" границами, не удается.

моделирующий код:

const int iu_count= 33000;
const int iu_size= 5000;

static int perc[101];
static int *arr;

	double chance= 0.66;
	arr= new int[iu_count];
	int i, k, j;

	for(i= 0; i < iu_count; ++i)
	{
		int sum= 0;
		int iu_sz= random(10, 1000);
		chance= 0.66;
		for(j= 0; j < iu_sz; ++j)
		{
			if (random(0.0, 1.0) < chance)
				++sum;
		}
		arr[i]= (sum * 100) / iu_sz;
	}

	for(k= 0; k <= 100; ++k)
		perc[k]= 0;
	for(i= 0; i < iu_count; ++i)
		++perc[arr[i]];

	delete [] arr;

Date: 2010-01-29 05:06 pm (UTC)
From: [identity profile] psilogic.livejournal.com
то же самое, но активность является случайной величиной, которая распределена приблизительно "нормально" на участке 0.42...0.90

Image

то же самое, но активность является случайной величиной, которая распределена приблизительно "нормально" на участке 0.00...1.32 с "обрезанием" по 1.0 (потому что активность выше 100% невозможна)

и вот тут оказывается похоже:

Image

Date: 2010-01-29 05:25 pm (UTC)
From: [identity profile] kireev.livejournal.com
А зачем в последнюю модель включать 1.32, если потом делать "обрезание"?

Date: 2010-01-29 06:38 pm (UTC)
From: [identity profile] psilogic.livejournal.com
Чтобы соблюсти два условия: сделать возможной активность 0 и сделать распределение активности симметричным относительно 0.66.

Активность на участке более 1 - это значит, что граждане пришли бы на участок в почти полном составе даже при меньшей мотивации. Но эта повышенная мотивация никак не может быть отражена, так как они не могут проголосовать дважды.

Вообще говоря, я не знаю, какая модель для активности правильная. Если посмотрите алгоритм моделирования, то там как бы каждый избиратель бросает жребий - идти на выборы или не идти. При сам бросок жребия использует некий шанс. Но какой? Для этого шанса непонятно, где взять модель.

Date: 2010-01-29 09:17 pm (UTC)
From: [identity profile] kireev.livejournal.com
=Активность на участке более 1 - это значит, что граждане пришли бы на участок в почти полном составе даже при меньшей мотивации=

Что-то эту часть я вообще не понимаю. Но модель, где есть скачок к 100% явно не может быть правильной.

Date: 2010-01-29 10:41 pm (UTC)
From: [identity profile] psilogic.livejournal.com
Попробую пояснить на примерах.
Активность 0,1 - в текущей ситуации только 10% граждан придут на выборы.
Активность 0,5 - в текущей ситуации половина граждан придут на выборы.
Активность 1,0 - в текущей ситуации все граждане (окромя внезапно заболевших и т.п.) придут на выборы.
Активность 1,5 - в текущей ситуации все граждане (окромя внезапно заболевших и т.п.) придут на выборы, и также все бы пришли на выборы, если бы ситуация способствовала тому меньше, чем текущая (скажем, случился бы внезапный 35-градусный мороз).

Date: 2010-01-29 11:29 pm (UTC)
From: [identity profile] kireev.livejournal.com
А как вообще может быть 1,5 - если это больше 100%? Я не понимаю, как эта цифра, которой не может быть в приниципе, может закладываться в модель?

Date: 2010-01-30 12:54 am (UTC)
From: [identity profile] psilogic.livejournal.com
Чисто технически

chance= randomNormal(0.0, 1.32);
...
if (random(0.0, 1.0) < chance) ++sum;

т.е. для участков, где выпадает 1.0 и более, явка сто-процентная, откуда и образуется этот пик.

Date: 2010-01-30 01:21 am (UTC)
From: [identity profile] kireev.livejournal.com
Нет, тут я, гуманитарий, уже пас: для меня этот пик непонятен все равно.

Date: 2010-01-30 08:26 am (UTC)
From: [identity profile] renivid.livejournal.com
Просто не надо относиться к этому 1.32 как к вероятности. Это не вероятность, это мотивированность. И при таких условиях пик на 100% может быть. То есть какой-то набор участков, где люди "очень хотят голосовать" - намного больше чем в среднем по стране. Например, тюрьмы, психбольницы, армия и т.п. То есть там они проголосуют даже, если все кандидаты перед выборами скажут по телеку, что все избиратели - лохи :).

Date: 2010-01-30 10:43 am (UTC)
From: [identity profile] kireev.livejournal.com
Да, есть такие. Правда многие из этих участков убраны из модели Бондаренко, так как там мало избирателей.

Date: 2010-01-29 05:37 pm (UTC)
From: [identity profile] oude-rus.livejournal.com
я написал было, что ваш оппонент прав, и даже аргументировал, но проклятый хомяк журнал все сожрал.

не суть, вы и сами все понимаете.

Date: 2010-01-29 08:06 pm (UTC)
From: [identity profile] les2.livejournal.com
Я бы также ожидал не вполне симметричного распределения. Более плавного в более близкую к 50% сторону, и более крутому к более близкою к краю.

February 2026

S M T W T F S
1234567
891011 121314
15161718192021
22232425262728

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Feb. 26th, 2026 03:48 pm
Powered by Dreamwidth Studios