75X75 в Стерлитамаке
Dec. 7th, 2011 12:39 pmКогда
oude_rus написал о башкирском городе Стерлитамак, где члены избиркомов возлюбили явку 75% и результат 75% за Единую Россию, мне стало интересно как вообще это все выглядит. А выглядит это вот так. Каждый может сходить по ссылке и убедиться сам. На пяти участках результат ЕР даже ровненько составил 75,00% Явка ровно 75,00% составила на шести участках городах. Наверное, председатели этих избиркомов после выборов легли спать с чувством выполненного долга. Замечу, что не везде явка могла составить 75%, скажем, участок 732, где явка 100% и более 90% за ЕР - это следственный изолятор, где по идее и должны были спать председатели этих избиркомов после выборов.


no subject
Date: 2012-01-16 05:04 pm (UTC)1. По Стерлитамаку: получить на 5 участках из 100 ровно 75.00% -- это не фокус, Вы правы. Но это иррелевантно: там вообще-то на 54 участках из 110 результат в диапазоне 74,71% ... 75,26%.
2. По Сергокалинскому району: Ваши цифры по каждому участку правильные. Вероятность получить результат в наблюдаемом диапазоне на одном участке -- около 10%. Участков там 29 штук. Почему Вы говорите, что эти вероятности нельзя перемножать, мне неясно. Можно, конечно. Получится примерно 0.1^29, т.е. p=10^-30. Это число Вас не удивляет?
3. Про поиск таких районов. Я автоматически проверил все тик (пользовался чуть другим алгоритмом, считал наблюдаемую и биномиальную дисперсию). Вот список совсем жестких тик: http://barouh.livejournal.com/393001.html?thread=640297#t640297 (он примерно совпадает со списком Баруха, который тоже проверял все тик). Вы что, всерьез будете утверждать, что этот список -- случайная выборка по стране? Могу Вас сказать, что для 95% процентов тик биномиальная дисперсия получается МЕНЬШЕ наблюдаемой, т.е. биномиальная модель практически всегда преуменьшает дисперсию (что неудивительно). И только в некоторых ТИК реальная дисперсия существенно меньше биномиальной. И все эти тик находятся сами знаете где.
no subject
Date: 2012-01-16 06:57 pm (UTC)2. Чтобы понять, что умножать нельзя, возьмите частный случай: 2-3 участка. Опишите все возможные комбинации, рассчитайте для них вероятность перемножением и сложите. Получится число сильно меньше 1, хотя все возможные комбинации учтены.
Мои цифры тоже не правильные. они взяты для чисто случайного распределения избирателей, а его не может быть. Люди не расселяются чисто случайным образом. У них семьи и все такое.
3. Прежде чем заниматься этим, нужно сперва отладить методику, которая пока выглядит не убедительно. Как минимум, средний размер участка брать не стоит.
no subject
Date: 2012-01-16 07:17 pm (UTC)Про умножение. Вы же сами перемножили, в примере про Стерлитамак. Если на одном участке вероятность попадения в интервал составляет 10%, и на другом 10%, то вероятность того, что они оба попадут в интервал, будет 1%, какие в этом могут быть сомнения?
При этом заметьте, что мой метод (в отличие от метода Баруха) не использует умножение вероятностей. Я просто считаю дисперсию.
no subject
Date: 2012-01-17 05:48 am (UTC)В Стерлитамаке я перемножил, что неправильно, конечно. Мне просто лень думать было (там и 10% - не факт, что верная оценка). Чтобы понять почему не 1%, разбейте избирателей на 2 участка, соберите все возможные комбинации, перемножьте и сложите. Должна получиться 1.
Если у вас есть возможность, можете собрать дисперсию, например, по возрасту населения. Например, по числу пенсионеров. Там же никто не пытается фальсифицировать, да? Удивитесь как эта дисперсия может "прыгать".
no subject
Date: 2012-01-17 08:30 am (UTC)т.е. перемножать неправильно. а как правильно?
no subject
Date: 2012-01-17 12:50 pm (UTC)no subject
Date: 2012-01-17 01:17 pm (UTC)пусть у вас есть 2 одинаковых биномиальных распределения, с p=0.5 и n=100. Какова вероятность того, что k=50 в обеих распределениях одновременно?
no subject
Date: 2012-01-18 04:39 pm (UTC)no subject
Date: 2012-01-18 09:02 pm (UTC)сформулируйте, пожалуйста, что именно "так и есть".
no subject
Date: 2012-01-19 07:04 am (UTC)no subject
Date: 2012-01-19 11:52 am (UTC)тогда, перед тем, как двигаться дальше, давайте подведем предварительные итоги:
1. Вероятности независимых распределений умножаются
2. Рассчет вероятности появления 75% за ЕР (в Стерлотамаке) в предположении независимых биномиальных распределений сделан верно.
3. Полученная (исчезающе малая) величина говорит нам, что распределения НЕ независимы.
К этому я бы еще добавил:
0. Люди, которые по вашему выражению совершают "открытия, там где их нет", все-таки немного знают математику, в то время как вы сами не в состоянии "просто рассчитать вероятность появления ровно 75% голосов" (это опять из вашего заглавного комментария).
У вас есть возражения по существу?
no subject
Date: 2012-01-17 08:52 am (UTC)Вопрос заключается в том, какие это могут быть факторы, которые действуют в 30 тик Северного Кавказа + Стерлитамаке, а больше НИГДЕ по стране не действуют. Сформулируйте уже это наконец, я Вас третий комментарий подряд спрашиваю!
Про перемножение: ну естественно получается 1. На одном участке биномиальное распределение, интеграл под ним 1. На другом участке биномиальное распределение, интеграл под ним 1. Разбиваем оба распределения на интервалы (бины), получается два разбиения единицы. Если попарно перемножить и все сложить, получится снова разбиение единицы. Сумма 1. Это очевидно.
no subject
Date: 2012-01-17 01:15 pm (UTC)Для Стерлитамака это может быть просто случайность. По теории вероятности она вполне допустима. С Северным Кавказом может быть своя причина (кроме фальсификаций), которой мы не знаем (клановость, семейственность, особенности быта). Тем не менее, если мы чего-то не знаем, это не значит, что любая наша фантазия окажется справедливой (земля не стоит на 3 китах, хоть версия и красивая была, приятнее чем теория гравитации).
= Если попарно перемножить и все сложить, получится снова разбиение единицы. Сумма 1. Это очевидно.
Это если участки полностью независимы, но у нас это не тот случай. Например, если человек переходит из одного участка в другой, то в одном +1, а в другом -1. Как минимум, должны сохранятся суммы (возможно, что-то еще, тут думать надо). Соответственно, любой комбинации не получится, а значит и умножать нельзя.
no subject
Date: 2012-01-17 11:13 pm (UTC)Итак, мы имеем экспериментальный факт: везде по стране дисперсия сильно выше биномиальной, а на Кавказе в некоторых районах -- сильно ниже. Мне представляется очевидным, что гипотеза жесточайших фальсификаций на Кавказе объясняет этот факт лучше всего. Вы верите, что этот факт объясняется каким-то другим Неведомым Фактором. Давайте проверим границы Вашей веры.
Вот, например, возьмем Бабаюртовский район Дагестана. Там на 18 участках из 24 КПРФ получила 21%, округленный до ближайшего целого числа голосов (!!). То есть вычислить кол-во голосов за КПРФ можно так: взять общее число проголосовавших, умножить на 0.21 и округлить до ближайшего целого. В результате процент КПРФ по участкам получится слегка разный, т.е. дисперсия по этим 18 участкам будет не равна нулю. Но эта дисперсия не просто меньше биномиальной; это в принципе минимальная возможная дисперсия, ограниченная лишь квантованием числа избирателей.
Вопрос. Вы и теперь верите в то, что результаты в Бабаюртовском районе возникли естественным образом?
no subject
Date: 2012-01-18 04:51 pm (UTC)Ну как закрыт. Если говорить о результатах, не соответствующих теоретической биномиальной модели, то не закрыт. Просто другие участки могут не соответствовать по другому, более сложым образом. Вы это не нашли, но это не значит, что этого нет.
= везде по стране дисперсия сильно выше биномиальной, а на Кавказе в некоторых районах -- сильно ниже. Мне представляется очевидным, что гипотеза жесточайших фальсификаций на Кавказе объясняет этот факт лучше всего.
Лучше - не значит правильно. Просто оно вам нравится и все. Кроме того, на Кавказе на этих участках крайне мало избирателей. Если согласно этой модели, фальсификации были только на Кавказе (причем на части УИК), то доля фальсификаций по стране будет подозрительно мала.
= Вы верите, что этот факт объясняется каким-то другим Неведомым Фактором. Давайте проверим границы Вашей веры.
Причем тут вера. Если кто-то уверен, что земля не обязательно стоит на 3 китах, но не знает на чем она вправду стоит, это не значит что он верит в Божественную Черепаху. Он всего навсего не знает ответа на вопрос.
= взять общее число проголосовавших, умножить на 0.21
На 0,29
= Вопрос. Вы и теперь верите в то, что результаты в Бабаюртовском районе возникли естественным образом?
Что значит естественный образ? Такой результат не мог возникнуть в ходе правильного смешивания, но никто и не смешивает избирателей правильным образом, скорее наоборот, они всегда как-то хитро распределены по своим законам.
В данном случае это конечно могли быть фальсификации, но с той же достоверностью могло быть какое-то другое явление, которые мы не видим, но которое их само распределило. Это можно точно выяснить только побывав там и поняв, как они там на самом деле живут и голосуют.
no subject
Date: 2012-01-18 06:22 pm (UTC)Вопрос: учитывая эту информацию и всю остальную информацию, имеющуюся в Вашем распоряжении, как Вы считаете, честно ли были подсчитаны голоса в этом районе? Варианты ответа:
А. Эти результаты вообще не имеют отношения к волеизъявлению людей и, скорее всего, получены в экселе умножением числа людей на 71% и округлением. Готов поставить как минимум сто к одному.
Б. Скорее всего, были фальсификации, но не поручусь, очень уж сомнительно. Если бы возникла возможность проверки, спорить бы не стал.
В. Результаты и вправду выглядят подозрительно, но я четко уверен, что в Дагестане выборы честные, поэтому в фальсификации не верю. Там просто избиратели так хитро живут. Перед нами социологический феномен, требующий отдельного изучения.
Г. Результаты не выглядят подозрительно, подумаешь невидаль.
no subject
Date: 2012-01-19 07:03 am (UTC)Тут много вопросов и ответы на них разные.
1. Были ли фальсификации? Не знаю.
2. Могло ли быть получен подобный результат умножением числа избирателей на некоторое число? Мог.
3. Мог ли он быть получен другим способом? Тоже мог. Например, это может быть комбинация некоторой неизвестной нам закономерности и стохастической раздачи. Или просто некоторая чистая закономерность.
4. Доказана ли фальсификация (умножение на 0,71 именно членами комиссии) статистически? Не доказана.
Меня больше удивляет почему тут всего 0,71, если в среднем по районам Дагестана гораздо больше. Не могли что ли на 0,91 умножить? Что за коммунистический рассадник?
no subject
Date: 2012-01-19 09:49 am (UTC)