kireev: (Default)
kireev ([personal profile] kireev) wrote2012-11-08 01:56 pm

538 vs Unskewed Polls

Я бы хотел написать о двух людях. Первый многим знаком - это Нэйт Сильвер, создатель сайта 538. Второй это Дин Чамберс, создатель сайта Unskewed Polls.

Эти выборы явились прямо звездным часом Сильвера. Его прогнозы были сильны и раньше, но сейчас он просто попал в точку. Даже  в последний момент вероятность победы Обамы во Флориде стала чуточку больше 50% и он действительно там победил с отрывом в 0.5%. Я думаю не только мне, но и другим людям, которым интересны опросы и статистика, было все эти месяцы просто невероятно интересно читать этот блог.

silver

При этом Сильвер подвергался критике. Основные направления тут были два. Первое: откуда у Обамы может быть такая высокая вероятность победы? Откуда такой разрыв в голосах, если общенациональные опросы показывают равенство?  Причины непонимания были разные. Иногда банальное непониманием статистики. Такое часто встречается даже у образованных людей: в моем только блоге дикие примеры встречались неоднократно. Что, кстати, мне напоминает о толковом предложении учить статистике в школе, потому что это как раз то, что в жизни может пригодиться. Иногда непонимание было вызвано тем, что общенациональные опросы не учитывают то, что президент избирается коллегией выборщиков, и даже при равенстве по общнециональным опросам у Обамы было просто больше геогрфаических путей к достижению необходимых для победы 270 голосов выборщиков. Другая причина: Нэйт Сильвер уделял большое внимание опросах в штатах. Они ведь тоже дают представление об общенациональной популярности кандидатов, если таких опросов много. А их было просто невероятно много. И опросы в штатах отличались на этот раз от общенациональных опросов тем, что показывали лучшую ситуцию для Обамы, чем для Ромни. Если смотреть только на общенациональные опросы, то Обама выигрывал у Ромни с отрывом может быть в 1%, а если на опросы по штатам, то где-то на 2.5 - 3%. В последний раз такое было в 2000 г. Опросы в штатах показывали равенство между Гором и Бушем. А общенациональные опросы показывали преимущество Буша 2-3%. Более верную картину показали в тот раз опросы по штатам: Гор во многом тогда сенсационно даже с минимальным отрывом выиграл popular vote. Сейчас тоже опросы по штатам были несколько точнее. Это не значит, что надо использовать только их, а не общенациональные опросы. Но важно понять, что они имеют не менее важное значение в определении общенациональных тенденций, как и общенациональные опросы. Этот тезис Сильвера блестяще подтвердился на этих выборах. Но если смотреть только на общенациональные опросы, да еще на опросы, которые выбирает RealClearPolitics, одбрасывая часть опросов, которые почему-то чаще более благоприятны для демократов, то создавалось впечатление равенства шансов Обамы и Ромни, а то и преимущества Ромни. Поэтому такая высокая вероятность победы Обамы при опросах которые вроде как показывают другое, вызывало недоумение и даже подозрения.

Второе направление атак: Сильвер - гомосексуалист и либерал. Понятное дело, его статистика работает в пользу Обамы. Да, я такое реально читал. Люди, которые так говорили, на мой взгляд, и тогда и тем более сейчас просто сгореть от стыда. Нэйт Сильвер поднял объективность анализа на какой-то новый уровень. Во-вторых, он сам опросы не придумывает, он их лишь статистически обрабатывает. Хотя, есть и некотие фундаментальные основы более долгосрочных прогнозов. Скажем, он как-то писал, что экономические показатели должны дать перевес инкумбенту в 3%. Правда, при приближении даты выборов экономическая составляющая прогноза уменьшалась вплоть до нуля к дню выборов и увеличивалась опросная составляющая прогноза вплоть до 100% к дню выборов. Учитываться и история опросов: у кого-то больше демократический уклон, а у кого-то больше республиканский.

Плюс, Сильвера явно недолюбливали некоторые политические комментаторы, потому что по сравнением с ним они действительно выглядят шарлатанами. Некоторые, как Джо Скарборо и Дэвид Брукс вообще отвергали идею, что статистические модели могут что-то нам сказать об этих выборах. Особенно запонился случай с ведующим политического ток-шоу Джо Скарборо, который сказал:
JOE SCARBOROUGH (10/23/2012): Nate Silver says this is a 76.3% chance the President's going to win? ... Anybody that thinks that this race is anything but a tossup right now is such an ideologue, they should be kept away from typewriters ... because they're jokes.
На что Сильвер просто ответил: All you have to do is take an average, and count to 270. It's a pretty simple set of facts. I'm sorry that Joe is math-challenged.

Мне бы хотелось сравнить сайт 538 и другой сайт, который в последнее время перед выборами получил некоторую известность http://unskewedpolls.com/ Это наглядная демонстрация разницы между человеком, который занимается настоящим, профессиональным и объективным анализом реальности, и человеком, который создает для себя и для других людей свою, альтернативную реальность, которая им больше нравится. Весь сайт, название которого можно перевести как “неперекошенные опросы" построен на неверной идее, что опросы намеренно включали в выборку много демократов, что неименуемо создавало перевес Обаме. Это просто не так, как основная масса опросов лишь взвешивает выборку по демографческим характеристикам: пол, раса, возраст и т.д., коим партийное самоопределение не является, так как люди его сами для себя определяют и по своему желанию меняют. Автор сайта Дин Чамберс спокойно брал опросы, смотрел какой там перевес у демократов, сам решал, что такого быть не может, вычитал лишний процент демократов и соответственно перекос в пользу Обамы, и приходил к “настоящему” результату. Мне даже было интересно как он будет после выборов выкручиться. Но спасибо хоть он признал, что ошибался, а Нэйт Сильвер был прав. Это же целый сайт, тысячи цифр, недели скрупулезной работы... спокойненько берем, сворачиваем и опускаем в мусорное ведро. Спасибо большое за то, что все это время морочил тысячам людей голову.

Какие из всего этого выводы? Я бы сделал два. Во-первых, статистика и выборы совместимы. Я сам постоянно использую цифры и статистику в анализе результатов выборов и фальсификаций в России. Поэтому разумеется мои симпатии тут были на стороне Сильвера. Второй вывод: "You can evade reality, but you cannot evade the consequences of evading reality". Ayn Rand.



[identity profile] revoltp.livejournal.com 2012-11-08 07:20 pm (UTC)(link)
Статистика- не мой интерес,я много тут не знаю. Но все же знаю:отрыв 0.5 процентов не может быть предсказан. всякое совпадение здесь - дело случая и не имеет отношения к мастерству социолога.
milchar: (kater)

[personal profile] milchar 2012-11-08 07:20 pm (UTC)(link)
Странно, что Нью-Мексико настолько демократический штат, а Индиана настолько безнадёжно республиканская. Вы случайно не знаете -- чем это объясняется?

[identity profile] geneus.livejournal.com 2012-11-08 07:22 pm (UTC)(link)
Спасибо.

Я тоже пользовался как сайтом Силвера так и Haffington Post и немножко обошел Вас в нашем конкурсе по штатам (хотя все мы недооценили Обаму, никто не переоценил).

Последняя наглая просьба: я уже подвел итоги, не могли бы Вы их перепостить?

[identity profile] geneus.livejournal.com 2012-11-08 07:22 pm (UTC)(link)
Достаточно посмотреть на жителей Индианы, чтоб понять, что они - республикацы :-))

[identity profile] geneus.livejournal.com 2012-11-08 07:23 pm (UTC)(link)
>Но все же знаю:отрыв 0.5 процентов не может быть предсказан

Обоснуйте

[identity profile] kireev.livejournal.com 2012-11-08 07:25 pm (UTC)(link)
Так он и не предсказал, что Флорида точно проголосует за Обаму. Этого действительно невозможно было знать точно. Но вероятность вычислена чуть более 50%, что уже говорит о том, что эта вероятность соотвествовала полученному результату.

[identity profile] kireev.livejournal.com 2012-11-08 07:26 pm (UTC)(link)
В Нью-Мексико более 40% латинос. А Индиана не такой уж прямо и республиканский штат. Даже за Обаму в 2008 г. проголосовал. А белые там не многим более республиканские чем в целом по стране.

[identity profile] kireev.livejournal.com 2012-11-08 07:27 pm (UTC)(link)
Ок!

[identity profile] soglyadataj.livejournal.com 2012-11-08 07:33 pm (UTC)(link)
Гэллап - единственный, кто промазал в понедельничном опросе (кроме Расмуссена, который как я понял, совсем ни о чем). Извините за просветительский вопрос - давно так "низко пал секам"?

[identity profile] kireev.livejournal.com 2012-11-08 07:43 pm (UTC)(link)
Вы бы лучше меня просветили про выражение "низко пал секам" - я его никогда даже не слышал.
milchar: (kater)

[personal profile] milchar 2012-11-08 07:45 pm (UTC)(link)
Т.е. в принципе оба штата -- колеблющиеся, и окончательный результат от каких-то текущих событий зависит (проблемы с экономикой, сложные отношения республиканцев с мексиканцами и т.п.)?

[identity profile] temur25.livejournal.com 2012-11-08 07:46 pm (UTC)(link)
В США хоть данные неверных опросов/экзит-поллов судорожно не удаляют, как кое-кто) Но методика Чамберса конечно лоставляет))

[identity profile] kireev.livejournal.com 2012-11-08 07:46 pm (UTC)(link)
Не то чтобы прямо колеблющиеся, но разница зависит от просто разных социально-демографических характеристик. Белые в Индиане чуть консервативнее, но и скорее чуть более сельские.
Edited 2012-11-08 19:47 (UTC)

[identity profile] kireev.livejournal.com 2012-11-08 07:47 pm (UTC)(link)
Зато в этот раз нет экзит-полов по всем штатам ((

[identity profile] chaotickgood.livejournal.com 2012-11-08 07:48 pm (UTC)(link)
Человек на второй фотографии похож на Милонова )

[identity profile] soglyadataj.livejournal.com 2012-11-08 07:52 pm (UTC)(link)
Интернет утверждает, что источник - квн-овская штука середины 90-х. Сейчас - сплошь и рядом присказка в ситуации, когда что-то знаменитое, с приличной репутацией замечено в чем-то нехорошем, или - как в данном случае - непрофессиональном. Наверно, чуть более точная присказка для данной ситуации давно ли "стал промахиваться Акела":)

[identity profile] temur25.livejournal.com 2012-11-08 07:57 pm (UTC)(link)
http://edition.cnn.com/election/2012/results/state/AL/president
А здесь разве не все штаты есть?

[identity profile] temur25.livejournal.com 2012-11-08 08:13 pm (UTC)(link)
И можно экстраваганный вопрос? Индейцы в США голосуют? А то на сайте Mapping America в Apache county, Arizona 74% other, подозреваю, что это все индейцы. И за Обаму 67%.

[identity profile] kireev.livejournal.com 2012-11-08 08:30 pm (UTC)(link)
:)))

[identity profile] kireev.livejournal.com 2012-11-08 08:31 pm (UTC)(link)
Гэллап уже точно не первый раз. В 2010 г. он предсказал республиканцам победу с первесом то ли в 14% то ли в 15%. Реально было 6.8%.

[identity profile] kireev.livejournal.com 2012-11-08 08:32 pm (UTC)(link)
Нет, не все. Даже таких больших как Техас и Джорджия нет.

[identity profile] kireev.livejournal.com 2012-11-08 08:32 pm (UTC)(link)
Конечно индейцы голосуют. В подавляющем большинстве за демократов.

[identity profile] temur25.livejournal.com 2012-11-08 08:34 pm (UTC)(link)
Ну я думал, может им всё равно, и явка там минимальна.

[identity profile] soglyadataj.livejournal.com 2012-11-08 08:53 pm (UTC)(link)
Про "не в первый" я наслышан:)

[identity profile] kireev.livejournal.com 2012-11-08 08:54 pm (UTC)(link)
Еще в 2000 г. у них просто дикие и необъяснимые изменения в рейтигах были между Бушем и Гором, которых явно не должно было быть. Да и в 2008 г. они прилично переоценили Обаму.

Page 1 of 3