kireev: (Default)
[personal profile] kireev
Когда [livejournal.com profile] oude_rus написал о башкирском городе Стерлитамак, где члены избиркомов возлюбили явку 75% и результат 75% за Единую Россию, мне стало интересно как вообще это все выглядит. А выглядит это вот так. Каждый может сходить по ссылке и убедиться сам. На пяти участках результат ЕР даже ровненько составил 75,00% Явка ровно 75,00% составила на шести участках городах. Наверное, председатели этих избиркомов после выборов легли спать с чувством выполненного долга. Замечу, что не везде явка могла составить 75%, скажем, участок 732, где явка 100% и более 90% за ЕР - это следственный изолятор, где по идее и должны были спать председатели этих избиркомов после выборов.

Date: 2012-01-14 02:27 pm (UTC)
From: [identity profile] skvoretz.livejournal.com
Что значит "вообще на всех"? Тоже самое когда женщина говорит "ты меня вообще не любишь и никогда не любил"? Мелкая женская истерика?
Или что? Что удивительного надо заметить? В числе 0,75 нет ничего удивительного. Оно имеет такое же статистическое право на существование, как и все остальные числа. И встречается 0,75 совсем не на всех участках, оно распределено вполне биномиально, что как раз говорит о вполне типичном распределении.
Математически, без обличительной истерики, можно описать в чем заключается невероятное событие?
Тоже самое касается "в свете этого". В свете чего? Что там надо увидеть, с точки зрения статистики?

Date: 2012-01-14 02:41 pm (UTC)
From: [identity profile] kireev.livejournal.com
То есть Вы не увидели в этих данных ничего, говорящего о том, что эти результаты нарисованные? Зафиксируем.

С точки зрения математики и статистики http://barouh.livejournal.com/393001.html

Date: 2012-01-15 10:42 am (UTC)
From: [identity profile] skvoretz.livejournal.com
В данных по Стерлитамаку все нормально. Отклонения от стандартного распределения, конечно, есть, но они вполне возможны (даже обязательны) при большом числе ТИК.

По этой ссылке данные по Сергокарлинскому району смотрятся, конечно, очень необычно, даже маловероятно. Надо оценивать верятность, но этот товарищ делает это неправильно. Соответственно, его оценка вероятности такого события может отличаться от верной на любую величину.
Я бы порекомендовал, прежде чем этим заниматься, разобраться в предмете. Иначе получается странно: попытка опровергать чужие результаты ошибочными своими.

Date: 2012-01-15 02:11 pm (UTC)
From: [identity profile] kireev.livejournal.com
Оцените вероятность распределения в Сергокалинском районе и Стерлитамаке по своей методике, пожалуйста.

Date: 2012-01-15 07:24 pm (UTC)
From: [identity profile] skvoretz.livejournal.com
В Дагестане вероятность попадания в диапазон по участкам такая примерно:
12% 18% 12% 13% 11% 11% 11% 8% 11% 10% 13% 14% 14% 13% 10% 11% 12% 16% 13% 9% 13% 14% 14% 13% 11% 12% 11% 11% 13%
Это при условии, что избиратели УИК абсолютно не зависимы, а избирателей им "насыпают" чисто случайным образом из некоторого бесконечного мешка.
Для получения следует использовать не нормальное, а биномиальное распределение.
Дальше эти вероятности в принципе нельзя перемножать. Чтобы убедиться в этом, можно проверить на малом числе избирателей и нескольких УИК. Все варианты распределения в сумме должны дать вероятность =1. Если просто перемножать, то будет сильно меньше 1.
Как делать правильно, я так с ходу не могу сказать. Задача довольно сложная, думать надо.
Со Стерлитамаком смотреть не интересно. Даже при грубом анализе, отклонения вполне допустимо.

Date: 2012-01-15 07:40 pm (UTC)
From: [identity profile] kireev.livejournal.com
=В Дагестане вероятность попадания в диапазон по участкам такая примерно:
12% 18% 12% 13% 11% 11% 11% 8% 11% 10% 13% 14% 14% 13% 10% 11% 12% 16% 13% 9% 13% 14% 14% 13% 11% 12% 11% 11% 13% =

Откуда все эти цифры? Это по Сергокалинскому району? ЕР получила там от 89,47% до 89,70% голосов на всех участках. Откуда взялись эти вероятности?

=Со Стерлитамаком смотреть не интересно. Даже при грубом анализе, отклонения вполне допустимо.=

В какой модели это распределение допустимо? И почему ничего подобного нет ни в одном районе русских областей?

Date: 2012-01-16 06:19 am (UTC)
From: [identity profile] skvoretz.livejournal.com
= Откуда все эти цифры? Это по Сергокалинскому району? ЕР получила там от 89,47% до 89,70% голосов на всех участках. Откуда взялись эти вероятности?
Это вероятности попадания голосов в этот маленький диапазон исходя из биномиального закона. Они, скорее всего, занижены, так как исходят из предположения чисто случайного распределения выборщиков. В реальности, так не бывает. В частности, там голоса только за коммунистов и ЕР (и это нормально). Скорее всего, за коммунистов голосуют пожилые. Чисто случайное распределение именно пожилых людей там не получается. Они же семьями живут. Старшее поколение, среднее, младшее.
= В какой модели это распределение допустимо? И почему ничего подобного нет ни в одном районе русских областей?
Вот в примитивной и допустимо. Этого достаточно. Более сложная как раз начнет объяснять эти странности. "Ничего подобного нет" - это вы плохо искали. Ищите лучше. Не обязательно 0,75, можно попробовать другие дроби 4/7, например.

Date: 2012-01-16 05:59 pm (UTC)
From: [identity profile] oude-rus.livejournal.com
1/6 подойдет?

Date: 2012-01-16 06:49 pm (UTC)
From: [identity profile] skvoretz.livejournal.com
Лучше брать дроби близкие к ожидаемой вероятности. 2/3 попробуйте.

Date: 2012-01-16 07:01 pm (UTC)
From: [identity profile] oude-rus.livejournal.com
а на 2/3 ничего особенного нету, вот ведь обида какая.

Date: 2012-01-17 05:50 am (UTC)
From: [identity profile] skvoretz.livejournal.com
Что значит нету? Совсем совсем нету? Может немного есть все-таки? Критерии того что "есть" какие? Внутренние ощущения?
Да, оно совсем не обязательно должно быть на 2/3. Процесс случайный. Вероятностный.

Date: 2012-01-17 07:48 am (UTC)
From: [identity profile] oude-rus.livejournal.com
вот вы и расскажите, что там есть. а я с удовольствием послушаю.

Date: 2012-01-17 12:47 pm (UTC)
From: [identity profile] skvoretz.livejournal.com
Есть какой-то стохастический шум, скорее всего. Шум нельзя описать и делать из него выводы тем более глупо.

Date: 2012-01-17 01:18 pm (UTC)
From: [identity profile] oude-rus.livejournal.com
нехорошо заниматься самоцитированием, но тем не менее:
"на 2/3 ничего особенного нету"
4мя записями выше.

Date: 2012-01-17 04:59 pm (UTC)
From: [identity profile] barouh.livejournal.com
Отклонения допустимы. А вот отсутствие отклонений (6 попаданий точно в 75%) недопустимы

Date: 2012-01-18 04:35 pm (UTC)
From: [identity profile] skvoretz.livejournal.com
Имеются ввиду отклонения от биномиального распределения.

Date: 2012-01-17 05:06 pm (UTC)
From: [identity profile] barouh.livejournal.com
У нас есть исход А - попадание результата ЕР в диапазон от и до. Как Вы сами посчитали, для отдельного участка вероятность такого исхода (одного и того же!) составляет от 8% до 18%

А теперь мы просто считаем вероятность того, что исход А выпадет во всех 29 случаях. Исход то один и тот же. И получим мы как раз вероятность в районе 10 в минус двадцатой-тридцатой степени

И да, если вспомнить Бернули и посчитать суммарную вероятность всех комбинаций - 29 А, 28 А и 1 не-А, 27 А и 2 не-А и так далее до 29 не-А - то мы (если нигде не ошибемся) получим на выходе аккуратную единицу

Date: 2012-01-18 04:37 pm (UTC)
From: [identity profile] skvoretz.livejournal.com
Это решение не соответствует задаче. У нас не бесконечный мешок избирателей. Их общее количество ограничено, а среднее должно остаться средним.

Date: 2012-01-18 04:59 pm (UTC)
From: [identity profile] barouh.livejournal.com
Строго говоря, вы правы. Наши исходы не взаимонезависимы. Но насколько я понимаю, погрешность тут возникает очень маленькая

Если у нас в генеральной совокупности 80% черных шаров, то вероятность получить в выборке из 500 шаров 79,5-80,5% черных шаров практически не зависит от размера ГС: будь-то это 10 тысяч шаров (весь ТИК) или 1000 шаров (оставшихся после того, как "сформировали" 18 кучек из 20)

Существенная разница возникает только на последнем шаге: если предпоследний участок попал в диапазон 79,5-80,5%, то и последний участок с вероятностью 100% попадет в этот же диапазон. Если мы считаем вероятность, что все участки ТИКа попадут в заданный диапазон, то тогда видимо вероятности исхода А надо возводить в степень N-1, где N - количество участков.

А если мы через Бернулли считаем вероятность получения исхода F не менее чем в X случаях, тогда взаимозависимостью участков кажется можно пренебречь

Date: 2012-01-19 06:11 am (UTC)
From: [identity profile] skvoretz.livejournal.com
Там разница возникает и на предпоследнем участке, она не такая заметная, но зависит, например, от размера оставшихся участков.
Как минимум, есть еще одна тонкость. Мы вероятность совпадения доли с некоторым, выбранным нами числом, но в общем случае они могут совпасть с другим числом. Значит все соседние числа надо рассчитать и учесть.
Может, мы еще что-то забыли, тут думать надо.
Хотя, все это пока "мелочь" по сравнению с тем, что нельзя использовать чисто биномиальную раздачу. А вот если использовать правильную, то может быть и не мелочь.

Date: 2012-01-19 10:40 am (UTC)
From: [identity profile] barouh.livejournal.com
Мы считаем вероятность попадания Х участков в определенный диапазон вокруг медианы. Число "определяется" не нами, а самим объектом

Про недопустимость использования биноминальной раздачи - можете рассказать подробнее? И недопустимо использовать на каком этапе - на уровне участка для расчета вероятности отклонения от медианы не больше Х? Или на уровне ТИК для расчета вероятности повторения этого исхода (отклонения менее Х) на определенном количестве участков? Насколько я понимаю, проблема именно с первым этапом (отдельный участок)
И что такое правильная раздача?

January 2026

S M T W T F S
    123
45 67 8910
1112 1314151617
1819202122 2324
25262728293031

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jan. 26th, 2026 06:17 am
Powered by Dreamwidth Studios