kireev: (Default)
[personal profile] kireev
По данным интересных результатов президентских выборов по участкамв Чикаго, где голосуют афро-американцы[livejournal.com profile] corbulon провел свой коронный тест по последним цифрам и сравнил их с Дагестаном, где процент любви к российскому президенту такой же, как и на негритянских участках Чикаго к американскому. Разница действительно наглядная.
Чикаго – «вотчина Обамы», там у него абсолютное преимущество. Ну, к примеру как э-э-э-… у Путина в Дагестане. Таблицу с результатами выборов в Чикаго мне любезно прислал[livejournal.com profile] kireev, а я ее протестировал по последней цифре. 
И вот что получается, если сравнить по одинаковой методике Чикаго и Дагестан.

Чикаго2012
Тут 1 004 794 голосов.
А W - это вероятность того (упрощаю), что результат получился случайно. Нормально, если W между 10 и 90%.

А теперь (гром барабанов) - на сцене Дагестан, двойник Чикаго по любви к действующему Президенту.


Зеленые линии - границы, в которые должны влезать все точки (для Чикаго они на графике вообще не умещаются).
Масштаб очень разный.

Вероятность такого нечаянного отклонения в Дагестане (чай не в Чикаго живем) - не 40 чикагских процентов,
а немного меньше: надо разделить на единичку с 65 нуликами
.



А [livejournal.com profile] kobak сделал вот такие графики



Пик приходится на 99.25% за Обаму. То есть при таком проценте количество участков со 100% за Обаму вовсе не является аномальным: это просто конечная точка при резком уменьшении количества участков после пика на 99.25%. Более подробные расчеты от [livejournal.com profile] kobak тут. И не одного участка с результатом 100% среди участков с количеством избирателей более 550, а таких около половины. То есть явные признаки естественного характера этих результатов. Тест [livejournal.com profile] corbulon же показывает, что если результаты в Дагестане точно рисовались на каком-то количестве участков, то результаты в Чикакого как минимум не были подогнаны под понравившиеся цифры. Это полностью не опровергает вероятность фальсификации, но все же эти тесты результаты на афро-американских участках в Чикаго проходят.  Это как раз наглядный пример, когда дружное голосование за одного кандидата не является статистичеки аномальным, и в то же время является объяснимым, что очень хорошо контрастирует с таким же дружным голосованием за другого кандидата в Дагестане, но уже необъяснимым и показывающим все признаки неестественности.
Page 1 of 3 << [1] [2] [3] >>

Date: 2012-11-27 02:26 pm (UTC)
From: [identity profile] oude-rus.livejournal.com
//результаты в Чикакого как минимум не были подогнаны под понравившиеся цифры. //

вот сколько раз уже говорил, и опять повторять приходится: ничего подобного тест корбулона не показывает.

Date: 2012-11-27 02:32 pm (UTC)
From: [identity profile] kireev.livejournal.com
Тогда у них другое понимание красоты, чем в Дагестане: 0 или 5 у них не вызывают особых эстетических чувств.

Date: 2012-11-27 02:38 pm (UTC)
From: [identity profile] oude-rus.livejournal.com
понимание красоты к делу не относится.

Date: 2012-11-27 02:49 pm (UTC)
From: [identity profile] kireev.livejournal.com
Это еще почему? Насколько я знаю, в американской школе статистике учат не больше, чем в советской. А уж в школах в этих районах точно не больше, чем в школах Дагестана. То есть никак. Поэтому я бы как раз подумал, что рисунки у них должны быть похожими.

Date: 2012-11-27 02:56 pm (UTC)
From: [identity profile] oude-rus.livejournal.com
//не было массового "рисования чисел из человеческих голов" в протоколах Чикаго. //

неправда.

Date: 2012-11-27 03:02 pm (UTC)
From: [identity profile] oude-rus.livejournal.com
давайте я сформулирую:

Тест им. Корбулона показал для Чикаго, что частотность последних цифр находится в пределах статистической погрешности.

Все.
А уж получилось так по естественным или противоестественным (аккуратные фальсификация, например) причинам -- тест не показывает и показать не может.

Date: 2012-11-27 03:04 pm (UTC)
From: [identity profile] oude-rus.livejournal.com
первое утверждение бездоказательно.
второе утверждение: тест не показывает, что это невозможно.

Date: 2012-11-27 03:07 pm (UTC)
From: [identity profile] kireev.livejournal.com
Это так, правда. Но ожидать, что в этих районах будут делать такие аккуратные фальсификации, может человек, который точно не имеет представление о том, что это за районы и на каком уровне там находится образование. Я не пытаюсь сказать, что Вы такой человек, я лишь говорю, что подобное распределение именно в данном случае говорит в пользу того, что оно получилось по естественным причинам.

Date: 2012-11-27 03:23 pm (UTC)
From: [identity profile] oude-rus.livejournal.com
это все, может, и так, но из теста это не следует.

еще раз: тест односторонен - если он не проходится, то вероятность ф велика, но если он проходится, то это ничего не говорит о наличии или отсутствии ф.

Date: 2012-11-27 03:25 pm (UTC)
From: [identity profile] oude-rus.livejournal.com
прошу прощения, но мне это в голову не приходит.
выкидывай последние цифры на пальцах.

Date: 2012-11-27 03:27 pm (UTC)
From: [identity profile] kireev.livejournal.com
Разве это не говорит об отсутсвии одного вида ф: рисования красивых чисел, оканчивающихся на 0 или 5?

Date: 2012-11-27 03:27 pm (UTC)
From: [identity profile] danillo.livejournal.com
ой, а можно ответ?

Date: 2012-11-27 03:48 pm (UTC)
From: [identity profile] oude-rus.livejournal.com
это говорит об отсутствии и еще одного вида ф: рисования чисел, оканчивающихся на 1 или 9. Или 2 и 4, как будет угодно.

В общем, хотите утверждать, что тест корбулона говорит о том, что цифры в Чикаго не были подогнаны - утверждайте. Но если за это арбат вас подвесит за яйца -- я вас предупреждал.

Date: 2012-11-27 03:48 pm (UTC)
From: [identity profile] oude-rus.livejournal.com
тест этого не показывает.
в остальном см. предыдущий ответ.

Date: 2012-11-27 03:49 pm (UTC)
From: [identity profile] kireev.livejournal.com
=это говорит об отсутствии и еще одного вида ф: рисования чисел, оканчивающихся на 1 или 9. Или 2 и 4, как будет угодно.=
Именно! То есть какие-то фальфикации все же этот тест исключает. Никто же и не говорит, что это исключает все остальные фальсификации и даже подгон, если там действительно аккуратно это делали.

Date: 2012-11-27 03:50 pm (UTC)
From: [identity profile] danillo.livejournal.com
класс! :)

Date: 2012-11-27 03:51 pm (UTC)
From: [identity profile] oude-rus.livejournal.com
а в избирательных протоколах округляют до 0 и 5 -- это тоже известно. я где-то встречал это, но уж не помню где.

Date: 2012-11-27 04:30 pm (UTC)
From: [identity profile] gomberg.livejournal.com
На самом деле, на сходную тему были серьезные эксперименты. Человеку действительно не свойственно правдоподобно фальсифицировать наборы случайных чисел. Правда, наиболее типичный результат в этих экспериментах не концентрация на некоторых цифрах, а, вовсе наоборот - ее отсутствие. Например, если людям дают задачу написать "случайную" последовательность независимых единиц и нулей, то там почти всегда будет очень заметная обратная автокорелляция (или как это по-русски): вероятность, что после единицы будет ноль (и наоборот) сильно завышена. Это, конечно, указывает только на то, что человеку плохо свойственно генерировать независимые события (точно так же, как человеку плохо дается понимать, что такое независимые события; но если последний "дефект" лечится математическим образованием, то от первого страдают и математики).

Но в этих экспериментах цель была поставлена несколько иная: формулироваться оно могло по-разному, но смысл обычно был в том, чтобы имитировать независимые реализации. Здесь такая задача не ставилась, поэтому и эаффект возможен иной. Было бы интересно провести нечто подобное в лаборатории, чтобы посмотреть, какие именно регулярности возникнут. Но в том, что они будут (и достаточно воспроизводимые), я практически не сомневаюсь.

Подобный эксперимент, в сочетании со статистическими тестами, действительно дал бы интересное доказательство. Но, естественно, оно не было бы "чисто статистическим" :)

Date: 2012-11-27 04:31 pm (UTC)
From: [identity profile] gomberg.livejournal.com
Это называется лабораторный эксперимент :)

Date: 2012-11-27 04:53 pm (UTC)
From: [identity profile] gomberg.livejournal.com
Будет зависеть. Но подозреваю, что не так много (ну, если в джунгли в поисках субъектов не забираться). Единственное что, иначе, возможно, себя будут вести люди, которым по работе нужно делать нечто похожее. Люди, на самом деле, удивительно в таких вещах предсказуемы. На мой взгляд, обойтись обычным пулом университетских студентов вполне можно.

Date: 2012-11-27 05:06 pm (UTC)
From: [identity profile] gomberg.livejournal.com
Я бы реально дал крайне занудное занятие по подсчету каких-то булавок. Причем в одних случаях рядом с считающим сидел бы монитор в белом халате, а в других - никого (можно поставить скрытую камеру, а можно, для чистоты, и не ставить). Можно еще пообещать, что по окончании эксперимента будет дивный фуршет (ароматы в лаборатории обеспечить). Будет весьма забавно.

Date: 2012-11-27 05:08 pm (UTC)
From: [identity profile] oude-rus.livejournal.com
так здесь же не считается автокорреляция, а только распределение, что есть гораздо грубее.

Например, если я буду писать в протоколах 12345678901234567890123 и т.д. в половине случаев, а другую половину возьму как есть, то тест корбулона пройдется замечательно, хотя автокорреляция будет дельта-функцией на пьедестале.

Date: 2012-11-27 05:19 pm (UTC)
From: [identity profile] gomberg.livejournal.com
Вне всякого сомнения тест пройдется. Вообще, любой тест пройдется, если знать, что его надо будет проходить. Даже автокорреляция. На самом деле, есть довольно известный случай опубликованой статьи на эту тему, про которую есть очень большие подозрения, что там кто-то намухлевал с данными (подозревают схалтуривших аспирантов в лаборатории при халатности авторов, но не пойманы - не воры, так что подробнее не буду). Там как раз хотели показать, что автокорреляции при определенных условиях не будет - и, о чудо, показали (условия довольно сложно - и, главное, дорого, по меркам лабораторного эксперимента в экономике - воспроизводимые). Увы, когда данные разрезали произвольно пополам, автокорреляция вернулась в каждой половине :)

Я это к тому, что любой статистический тест в данном случае вообще имеет смысл только, если фальсификатор не ожидает, что его будут ловить с помощью этого теста. Но если не ожидает, то он будет действовать проще, а что такое "проще", на самом деле, довольно предсказуемо. Но, безусловно, не одной статистикой, а экспериментом и наблюдением.

Date: 2012-11-27 05:25 pm (UTC)
From: [identity profile] gomberg.livejournal.com
Кстати, я думаю, что вполне было бы публикабельно. Может мне заявку на грант подать? Хм...

Date: 2012-11-27 05:32 pm (UTC)
From: [identity profile] oude-rus.livejournal.com
самый известный случай - это Hendrik Schön. Его поймали на идентичном спектре шума на совершенно разных графиках.
Page 1 of 3 << [1] [2] [3] >>

March 2026

S M T W T F S
12 34567
891011121314
15161718192021
22232425262728
293031    

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Mar. 3rd, 2026 09:18 am
Powered by Dreamwidth Studios