kireev: (Default)
[personal profile] kireev
Когда [livejournal.com profile] oude_rus написал о башкирском городе Стерлитамак, где члены избиркомов возлюбили явку 75% и результат 75% за Единую Россию, мне стало интересно как вообще это все выглядит. А выглядит это вот так. Каждый может сходить по ссылке и убедиться сам. На пяти участках результат ЕР даже ровненько составил 75,00% Явка ровно 75,00% составила на шести участках городах. Наверное, председатели этих избиркомов после выборов легли спать с чувством выполненного долга. Замечу, что не везде явка могла составить 75%, скажем, участок 732, где явка 100% и более 90% за ЕР - это следственный изолятор, где по идее и должны были спать председатели этих избиркомов после выборов.

Date: 2012-01-13 06:55 am (UTC)
From: [identity profile] skvoretz.livejournal.com
Всем кто знает математику, рекомендую просто рассчитать вероятность появления ровно 75% голосов и больше на эту тему не заморачиваться.
Кто не знает математику, могут и дальше совершать "открытия", там где их нет.

Date: 2012-01-13 12:33 pm (UTC)
From: [identity profile] kireev.livejournal.com
Так расчитайте!

Date: 2012-01-13 03:29 pm (UTC)
From: [identity profile] skvoretz.livejournal.com
Если положить вероятность голосов за ЕР в Стерлитамаке как 0,75, то вероятность получить те же 0,75 для 6 УИК составляет по: 2,74% 2,22% 2,55% 2,78% 2,72% 2,78%.
Положим среднюю 2,63% тогда вероятность, что по ТИК таких участков из 100 будет больше чем 5, составяляет 4,89%.
Вероятность того, что из сотен ТИК выпадает хоть одно ТИК с такой вероятностью практически 100%.

Date: 2012-01-13 04:23 pm (UTC)
From: [identity profile] kireev.livejournal.com
Спасибо за ресчеты. Правда, Вы умудрились пропустить момент над которым все смеются: что на всех участках явка и за ЕР 75 на 75 как под копирку.

Date: 2012-01-13 04:43 pm (UTC)
From: [identity profile] skvoretz.livejournal.com
Математика - вообще смешная штука. Там такие числа ржачные, некоторые, например, меньше чем 0. Вот оборжака-то! А бывает, что некоторые цифры вообще совпадают. Например, e=2.718281828 там 1828 - 2 раза подряд. Это же - чушь! Сразу видно, что математики это число из головы выдумали, но у них фантазии не хватило разные цифры сделать.

Date: 2012-01-13 04:45 pm (UTC)
From: [identity profile] kireev.livejournal.com
Да, а люди вообще в лотерею выигрывают. Значит ли это что такое распределение голосов на участках в Стерлитамаке может быть?

Date: 2012-01-14 03:05 am (UTC)
From: [identity profile] skvoretz.livejournal.com
Вопрос примерно аналогичен: могут ли люди выигрывать в лотерею? Могут.
Люди выигрывают в лотерею. "Необычное" распределение голосов должно было где-нибудь появиться. При том, что распределение с вероятностью около 1/20 не такое уж и не обычное.

Date: 2012-01-14 12:28 pm (UTC)
From: [identity profile] kireev.livejournal.com
Вы опять-таки умудрились пропустить то, что речь не о том, что 75,00% невероятно - это как раз не такая уж и маленькая вероятность, а что вообще на всех участках 75 на 75, а это уже совершенно невероятно. Гораздо невероятнее любой лотерии. Особенно в свете этого http://kireev.livejournal.com/725142.html

Date: 2012-01-14 02:27 pm (UTC)
From: [identity profile] skvoretz.livejournal.com
Что значит "вообще на всех"? Тоже самое когда женщина говорит "ты меня вообще не любишь и никогда не любил"? Мелкая женская истерика?
Или что? Что удивительного надо заметить? В числе 0,75 нет ничего удивительного. Оно имеет такое же статистическое право на существование, как и все остальные числа. И встречается 0,75 совсем не на всех участках, оно распределено вполне биномиально, что как раз говорит о вполне типичном распределении.
Математически, без обличительной истерики, можно описать в чем заключается невероятное событие?
Тоже самое касается "в свете этого". В свете чего? Что там надо увидеть, с точки зрения статистики?

Date: 2012-01-14 02:41 pm (UTC)
From: [identity profile] kireev.livejournal.com
То есть Вы не увидели в этих данных ничего, говорящего о том, что эти результаты нарисованные? Зафиксируем.

С точки зрения математики и статистики http://barouh.livejournal.com/393001.html

Date: 2012-01-15 10:42 am (UTC)
From: [identity profile] skvoretz.livejournal.com
В данных по Стерлитамаку все нормально. Отклонения от стандартного распределения, конечно, есть, но они вполне возможны (даже обязательны) при большом числе ТИК.

По этой ссылке данные по Сергокарлинскому району смотрятся, конечно, очень необычно, даже маловероятно. Надо оценивать верятность, но этот товарищ делает это неправильно. Соответственно, его оценка вероятности такого события может отличаться от верной на любую величину.
Я бы порекомендовал, прежде чем этим заниматься, разобраться в предмете. Иначе получается странно: попытка опровергать чужие результаты ошибочными своими.

(no subject)

From: [identity profile] kireev.livejournal.com - Date: 2012-01-15 02:11 pm (UTC) - Expand

(no subject)

From: [identity profile] skvoretz.livejournal.com - Date: 2012-01-15 07:24 pm (UTC) - Expand

(no subject)

From: [identity profile] kireev.livejournal.com - Date: 2012-01-15 07:40 pm (UTC) - Expand

(no subject)

From: [identity profile] skvoretz.livejournal.com - Date: 2012-01-16 06:19 am (UTC) - Expand

(no subject)

From: [identity profile] oude-rus.livejournal.com - Date: 2012-01-16 05:59 pm (UTC) - Expand

(no subject)

From: [identity profile] skvoretz.livejournal.com - Date: 2012-01-16 06:49 pm (UTC) - Expand

(no subject)

From: [identity profile] oude-rus.livejournal.com - Date: 2012-01-16 07:01 pm (UTC) - Expand

(no subject)

From: [identity profile] skvoretz.livejournal.com - Date: 2012-01-17 05:50 am (UTC) - Expand

(no subject)

From: [identity profile] oude-rus.livejournal.com - Date: 2012-01-17 07:48 am (UTC) - Expand

(no subject)

From: [identity profile] skvoretz.livejournal.com - Date: 2012-01-17 12:47 pm (UTC) - Expand

(no subject)

From: [identity profile] oude-rus.livejournal.com - Date: 2012-01-17 01:18 pm (UTC) - Expand

(no subject)

From: [identity profile] barouh.livejournal.com - Date: 2012-01-17 04:59 pm (UTC) - Expand

(no subject)

From: [identity profile] skvoretz.livejournal.com - Date: 2012-01-18 04:35 pm (UTC) - Expand

(no subject)

From: [identity profile] barouh.livejournal.com - Date: 2012-01-17 05:06 pm (UTC) - Expand

(no subject)

From: [identity profile] skvoretz.livejournal.com - Date: 2012-01-18 04:37 pm (UTC) - Expand

(no subject)

From: [identity profile] barouh.livejournal.com - Date: 2012-01-18 04:59 pm (UTC) - Expand

(no subject)

From: [identity profile] skvoretz.livejournal.com - Date: 2012-01-19 06:11 am (UTC) - Expand

(no subject)

From: [identity profile] barouh.livejournal.com - Date: 2012-01-19 10:40 am (UTC) - Expand

Date: 2012-01-16 05:04 pm (UTC)
From: [identity profile] kobak.livejournal.com
Прочитал ваш разговор с kireev. Три комментария.

1. По Стерлитамаку: получить на 5 участках из 100 ровно 75.00% -- это не фокус, Вы правы. Но это иррелевантно: там вообще-то на 54 участках из 110 результат в диапазоне 74,71% ... 75,26%.

2. По Сергокалинскому району: Ваши цифры по каждому участку правильные. Вероятность получить результат в наблюдаемом диапазоне на одном участке -- около 10%. Участков там 29 штук. Почему Вы говорите, что эти вероятности нельзя перемножать, мне неясно. Можно, конечно. Получится примерно 0.1^29, т.е. p=10^-30. Это число Вас не удивляет?

3. Про поиск таких районов. Я автоматически проверил все тик (пользовался чуть другим алгоритмом, считал наблюдаемую и биномиальную дисперсию). Вот список совсем жестких тик: http://barouh.livejournal.com/393001.html?thread=640297#t640297 (он примерно совпадает со списком Баруха, который тоже проверял все тик). Вы что, всерьез будете утверждать, что этот список -- случайная выборка по стране? Могу Вас сказать, что для 95% процентов тик биномиальная дисперсия получается МЕНЬШЕ наблюдаемой, т.е. биномиальная модель практически всегда преуменьшает дисперсию (что неудивительно). И только в некоторых ТИК реальная дисперсия существенно меньше биномиальной. И все эти тик находятся сами знаете где.

Date: 2012-01-16 06:57 pm (UTC)
From: [identity profile] skvoretz.livejournal.com
1. Ну и что? На самом деле, и биномиальная модель не совсем точно описывает ситуацию Я уже описал почему - избиратели не берутся из мешка случайным образом. Они живут там и распределяются равномернее, чем случайно.
2. Чтобы понять, что умножать нельзя, возьмите частный случай: 2-3 участка. Опишите все возможные комбинации, рассчитайте для них вероятность перемножением и сложите. Получится число сильно меньше 1, хотя все возможные комбинации учтены.
Мои цифры тоже не правильные. они взяты для чисто случайного распределения избирателей, а его не может быть. Люди не расселяются чисто случайным образом. У них семьи и все такое.
3. Прежде чем заниматься этим, нужно сперва отладить методику, которая пока выглядит не убедительно. Как минимум, средний размер участка брать не стоит.

Date: 2012-01-16 07:17 pm (UTC)
From: [identity profile] kobak.livejournal.com
Еще раз: методика действительно не идеальная, и мне самому там много не нравится (как Вы выше заметили, посчитать это аккуратно довольно трудно). Но даже если это совершенно никуда не годная методика, она каким-то образом выделяет из всех российских тик 30 "исключительных", на которых наблюдаемая дисперсия особенно мала по сравнению с биномиальной. Все эти 30 тик находятся на Кавказе + парочка в Башкиртостане и Татарстане. Если Вы отвергаете "очевидное" объяснение с подделанными под копирку результатами, Вам нужно предложить какое-то альтернативное объяснение. Почему именно там дисперсия так мала.

Про умножение. Вы же сами перемножили, в примере про Стерлитамак. Если на одном участке вероятность попадения в интервал составляет 10%, и на другом 10%, то вероятность того, что они оба попадут в интервал, будет 1%, какие в этом могут быть сомнения?

При этом заметьте, что мой метод (в отличие от метода Баруха) не использует умножение вероятностей. Я просто считаю дисперсию.

Date: 2012-01-17 05:48 am (UTC)
From: [identity profile] skvoretz.livejournal.com
Размер дисперсии определяется однородностью распределения избирателей по УИКам. Сами УИКи распределяются по деревням и районам города. Они могут быть как однородными (одинаково бедными), так и нет. Например, можно рассмотреть цену кв.м. жилья. Если в пределах одного ТИК она отличается раза в 2, то это же может влиять на голосование. Есть другие факторы. Например, студенческие городки (много общежитий в одном УИК). Районы новой застройки. В одном квартале хрущевки, пенсионеры живущие там по 50 лет, в другом новые дома с консьержками. Это расслоение влияет на дисперсию неизвестным нам образом.
В Стерлитамаке я перемножил, что неправильно, конечно. Мне просто лень думать было (там и 10% - не факт, что верная оценка). Чтобы понять почему не 1%, разбейте избирателей на 2 участка, соберите все возможные комбинации, перемножьте и сложите. Должна получиться 1.
Если у вас есть возможность, можете собрать дисперсию, например, по возрасту населения. Например, по числу пенсионеров. Там же никто не пытается фальсифицировать, да? Удивитесь как эта дисперсия может "прыгать".

Date: 2012-01-17 08:30 am (UTC)
From: [identity profile] oude-rus.livejournal.com
//я перемножил, что неправильно//

т.е. перемножать неправильно. а как правильно?

Date: 2012-01-17 12:50 pm (UTC)
From: [identity profile] skvoretz.livejournal.com
Надо использовать что-то вроде биномиальных формул. Я так не могу сразу сказать. Тут надо внимательно разбираться во всех комбинациях.

Date: 2012-01-17 01:17 pm (UTC)
From: [identity profile] oude-rus.livejournal.com
вот и давайте разберемся.
пусть у вас есть 2 одинаковых биномиальных распределения, с p=0.5 и n=100. Какова вероятность того, что k=50 в обеих распределениях одновременно?

Date: 2012-01-18 04:39 pm (UTC)
From: [identity profile] skvoretz.livejournal.com
Для независимых распределений так и есть. Для двух зависимых общая вероятность равна вероятности выпадения в одной из них.

Date: 2012-01-18 09:02 pm (UTC)
From: [identity profile] oude-rus.livejournal.com
//Для независимых распределений так и есть.//

сформулируйте, пожалуйста, что именно "так и есть".

(no subject)

From: [identity profile] skvoretz.livejournal.com - Date: 2012-01-19 07:04 am (UTC) - Expand

(no subject)

From: [identity profile] oude-rus.livejournal.com - Date: 2012-01-19 11:52 am (UTC) - Expand

Date: 2012-01-17 08:52 am (UTC)
From: [identity profile] kobak.livejournal.com
Я не спорю с тем, что дисперсия может прыгать. Я не спорю с тем, что мое вычисление не идеально. Я не спорю с тем, что реальная дисперсия почти всегда выше биномиальной (неоднородность участков). Я даже не спорю с тем, что могут быть какие-то естественные факторы, которые приведут к систематически более низкой дисперсии, чем биномиальная (хотя не думаю, что такое возможно).

Вопрос заключается в том, какие это могут быть факторы, которые действуют в 30 тик Северного Кавказа + Стерлитамаке, а больше НИГДЕ по стране не действуют. Сформулируйте уже это наконец, я Вас третий комментарий подряд спрашиваю!

Про перемножение: ну естественно получается 1. На одном участке биномиальное распределение, интеграл под ним 1. На другом участке биномиальное распределение, интеграл под ним 1. Разбиваем оба распределения на интервалы (бины), получается два разбиения единицы. Если попарно перемножить и все сложить, получится снова разбиение единицы. Сумма 1. Это очевидно.

Date: 2012-01-17 01:15 pm (UTC)
From: [identity profile] skvoretz.livejournal.com
= Вопрос заключается в том, какие это могут быть факторы, которые действуют в 30 тик Северного Кавказа + Стерлитамаке, а больше НИГДЕ по стране не действуют.
Для Стерлитамака это может быть просто случайность. По теории вероятности она вполне допустима. С Северным Кавказом может быть своя причина (кроме фальсификаций), которой мы не знаем (клановость, семейственность, особенности быта). Тем не менее, если мы чего-то не знаем, это не значит, что любая наша фантазия окажется справедливой (земля не стоит на 3 китах, хоть версия и красивая была, приятнее чем теория гравитации).
= Если попарно перемножить и все сложить, получится снова разбиение единицы. Сумма 1. Это очевидно.
Это если участки полностью независимы, но у нас это не тот случай. Например, если человек переходит из одного участка в другой, то в одном +1, а в другом -1. Как минимум, должны сохранятся суммы (возможно, что-то еще, тут думать надо). Соответственно, любой комбинации не получится, а значит и умножать нельзя.

Date: 2012-01-17 11:13 pm (UTC)
From: [identity profile] kobak.livejournal.com
Ну наконец-то! То есть Ваша гипотеза заключается в том, что на Северном Кавказе действуют какие-то неведомые нам факторы, которые приводят к очень низкой дисперсии результатов, при том что по всей остальной стране такого нигде не наблюдается. Полагаю, что вопрос с тем, что мы такие ТИКи "плохо искали" и надо "искать лучше" (как Вы тут выше писали) закрыт. Очень хорошо.

Итак, мы имеем экспериментальный факт: везде по стране дисперсия сильно выше биномиальной, а на Кавказе в некоторых районах -- сильно ниже. Мне представляется очевидным, что гипотеза жесточайших фальсификаций на Кавказе объясняет этот факт лучше всего. Вы верите, что этот факт объясняется каким-то другим Неведомым Фактором. Давайте проверим границы Вашей веры.

Вот, например, возьмем Бабаюртовский район Дагестана. Там на 18 участках из 24 КПРФ получила 21%, округленный до ближайшего целого числа голосов (!!). То есть вычислить кол-во голосов за КПРФ можно так: взять общее число проголосовавших, умножить на 0.21 и округлить до ближайшего целого. В результате процент КПРФ по участкам получится слегка разный, т.е. дисперсия по этим 18 участкам будет не равна нулю. Но эта дисперсия не просто меньше биномиальной; это в принципе минимальная возможная дисперсия, ограниченная лишь квантованием числа избирателей.

Вопрос. Вы и теперь верите в то, что результаты в Бабаюртовском районе возникли естественным образом?

Date: 2012-01-18 04:51 pm (UTC)
From: [identity profile] skvoretz.livejournal.com
= Полагаю, что вопрос с тем, что мы такие ТИКи "плохо искали" и надо "искать лучше" (как Вы тут выше писали) закрыт.

Ну как закрыт. Если говорить о результатах, не соответствующих теоретической биномиальной модели, то не закрыт. Просто другие участки могут не соответствовать по другому, более сложым образом. Вы это не нашли, но это не значит, что этого нет.

= везде по стране дисперсия сильно выше биномиальной, а на Кавказе в некоторых районах -- сильно ниже. Мне представляется очевидным, что гипотеза жесточайших фальсификаций на Кавказе объясняет этот факт лучше всего.

Лучше - не значит правильно. Просто оно вам нравится и все. Кроме того, на Кавказе на этих участках крайне мало избирателей. Если согласно этой модели, фальсификации были только на Кавказе (причем на части УИК), то доля фальсификаций по стране будет подозрительно мала.

= Вы верите, что этот факт объясняется каким-то другим Неведомым Фактором. Давайте проверим границы Вашей веры.

Причем тут вера. Если кто-то уверен, что земля не обязательно стоит на 3 китах, но не знает на чем она вправду стоит, это не значит что он верит в Божественную Черепаху. Он всего навсего не знает ответа на вопрос.

= взять общее число проголосовавших, умножить на 0.21

На 0,29

= Вопрос. Вы и теперь верите в то, что результаты в Бабаюртовском районе возникли естественным образом?

Что значит естественный образ? Такой результат не мог возникнуть в ходе правильного смешивания, но никто и не смешивает избирателей правильным образом, скорее наоборот, они всегда как-то хитро распределены по своим законам.
В данном случае это конечно могли быть фальсификации, но с той же достоверностью могло быть какое-то другое явление, которые мы не видим, но которое их само распределило. Это можно точно выяснить только побывав там и поняв, как они там на самом деле живут и голосуют.

Date: 2012-01-18 06:22 pm (UTC)
From: [identity profile] kobak.livejournal.com
Вера здесь при том, что я спрашиваю Вас о Вашем личном мнении. Попробую еще раз. Мы говорим о Бабаюртовском районе Дагестана, где на 18 участках из 24 ЕР получила ровно 71% голосов, округленные до ближайшего целого числа избирателей. Участки там не маленькие, в районе 1000 человек: http://ruelect.com/ru/?tree_id=159.

Вопрос: учитывая эту информацию и всю остальную информацию, имеющуюся в Вашем распоряжении, как Вы считаете, честно ли были подсчитаны голоса в этом районе? Варианты ответа:

А. Эти результаты вообще не имеют отношения к волеизъявлению людей и, скорее всего, получены в экселе умножением числа людей на 71% и округлением. Готов поставить как минимум сто к одному.

Б. Скорее всего, были фальсификации, но не поручусь, очень уж сомнительно. Если бы возникла возможность проверки, спорить бы не стал.

В. Результаты и вправду выглядят подозрительно, но я четко уверен, что в Дагестане выборы честные, поэтому в фальсификации не верю. Там просто избиратели так хитро живут. Перед нами социологический феномен, требующий отдельного изучения.

Г. Результаты не выглядят подозрительно, подумаешь невидаль.

(no subject)

From: [identity profile] skvoretz.livejournal.com - Date: 2012-01-19 07:03 am (UTC) - Expand

(no subject)

From: [identity profile] kobak.livejournal.com - Date: 2012-01-19 09:49 am (UTC) - Expand

January 2026

S M T W T F S
    123
45 67 8910
1112 1314151617
1819202122 2324
25262728293031

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jan. 26th, 2026 06:17 am
Powered by Dreamwidth Studios