kireev: (Default)
[personal profile] kireev
Когда я разбирал фальсификации на выборах в России, то в них были просто видны географические аномалии. Да вспомните хотя бы тот же 1996 г., когда голосование было очень идеологическим: во втором туре у Зюганова кое-где в республиках вдруг резко могло упасть число голосов, что явно говорило о фальсификациях. Ну или знаменитые случаи на президентских выборах 2012 г. когда Путин получал меньше, чем Единая Росси в декабре 2011 г. (причем, даже в абсолютных показателях, а не в процентах),: полный нонсенс, но там сначала фальсификации были, а потом их не было, вот такие нонсенсы и получались. Ну или помните, мои "черепахи" в Москве? В Украине мы обсужадали подобные географические аномалии при фальсификациях. Вобщем, случаев множество только в моем блоге обсуждалось.

Сейчас в ряде штатов еще далеко не все голоса подсчитаны. Но в большинстве практически все подсчитано. Если бы значительные фальсификации, то должны были быть аномалии. Вот за Трампа в 2016 г. тут было 75%, а теперь 30%, как такое может быть вдруг? В США-то ведь голосование очень идеологическое, демократы за своего, республиканцы за своего, и географические аномалии тут буду хорошо видны. Вот было обвинение про вброс в Милуоки. Где он виден в результате? Нигде не виден. Если вы считаете, что были фальсификации, пусть даже локальные, против Трампа и в пользу Байдена, то результаты в там должны неименуемо противоречить результатам президентских выборов 2016 г.

В принципе, можно пойти на любой сайт, где есть результаты и по штатам и по округам, и показать мне эти аномальные результаты. Ну, вот, скажем, с оттенками по округам мне нравится смотреть на сайте Нью-Йорк Таймс. Там же и стрелочки показывают сдвиг по сравнению с 2016 г.  Можете посмотреть и показать мне серьезные аномалии, которые ну никак невоможно объяснить социально-демографическими характеристиками этих мест.  Скажем, как уже известно, Байден больше набирает среди белых, Трамп - среди меньшинств. Байден в пригородах, а Трамп на селе, а кое-где и в центральных частях крупных городов, где больше меньшинств.

Так что если вы считаете, что в США на президентских выборах были значительные фальсификации, вы, наверняка, легко найдете эти аномалии и покажите мне их. Я же утверждаю, что таковых не было,  и ничего вы, прохиндеи, не найдете. Только, чур, в пользу Байдена должно быть, в пользу Трампа не принимается :) А то я сразу покажу округ Старр в Техасе, где свиг в пользу Трампа 55% по сравнению с 2016 г. :)

Воспользуюсь случаем и расскажу о своей находке. Меня удивил округ Уэйн в Огайо. Ничем не примечательный, но тут самый большой сдвиг в пользу демократа по стране +18%. Вот я ниже повесил скриншот с сайта Нью-Йорк Таймс.. Я подумал: как такое может быть? В похожих округах чаще наоборот даже сдвиг в пользу Трампа. Пошел на сайт избирательной комиссии этого округа и посмотрел результаты выборов там. На сайте Нью-Йорк Таймс техническая ошибка - результаты на самом деле другие: 67,8% на 30,7%, что отлично вписывается в 64,3% на 29,9% в 2016 и умеренный сдвиг вправо, как и в других округах.

Date: 2020-11-07 08:36 pm (UTC)
From: [identity profile] blajer.livejournal.com
Ну держите аномалии (https://github.com/cjph8914/2020_benfords). Не географические, но когда-то Вы такими графиками очень интересовались.
Milwaukee:
Image
Allegheny county, PA:
Image

Date: 2020-11-07 09:04 pm (UTC)
From: [identity profile] sevabashirov.livejournal.com
Соответствуют ли наборы данных обязательным условиям для выполнения закона Бенфорда:
1) разброс в несколько (не менее 2) порядков, в данном случае - не менее чем в 100 раз;
2) абсолютный характер (количество, размеры чего-либо, но не проценты)?
Edited Date: 2020-11-07 09:05 pm (UTC)

Date: 2020-11-07 09:07 pm (UTC)
From: [identity profile] blajer.livejournal.com
Второе точно да. Первое не до конца уверен (но для других кандидатов, как назло, красиво выполняется, только для одного нет и только там, где и из других данных мы можем аргументированно предполагать манипуляции). Сейчас попытаюсь добыть данные сам и поиграю с другими системами счисления (6, 7).

Date: 2020-11-07 09:14 pm (UTC)
From: [identity profile] sevabashirov.livejournal.com
Второе - да (уже увидел, что это кол-во голосов), хотел убрать, но вы уже ответили.

Да, надо испытать проверку на смену основания системы счисления. Плюс еще помнить - если размер участков колеблется в довольно ограниченном диапазоне, и %-ный результат кандидата - тоже, то и их произведение также вряд ли будет в пределе стремиться к "лог-равномерному" распределению, а именно такие данные соответствуют Бенфорду.

Скажем, если на участках от 500 до 3000 избирателей и результат кандидата от 80 до 20%, это разброс всего лишь от 100 до 2400 - по основаниям 2-3-4 можно проверить, 5-6 - уже рискованно, 7 и более - нет смысла.
(deleted comment)

Date: 2020-11-07 10:15 pm (UTC)
From: [identity profile] blajer.livejournal.com
Я сделал сам, используя скачанный по ссылке эксель.
Вот Байден:
Image
Вот Трамп:
Image
А вот количество участков с данной явкой в процентах:
Image

Date: 2020-11-07 10:20 pm (UTC)
From: [identity profile] kireev.livejournal.com
Я стер коммент, потому что я вначале подумал, что речь о первой цифре после запятой. Спрошу у людей, которые в Законе Бенфорда понимаю больше меня.

Date: 2020-11-07 10:25 pm (UTC)
From: [identity profile] blajer.livejournal.com
Я признаю, что данные, возможно, не распределены достаточно "широко", чтобы закон хорошо был виден. Но то, что отклонение именно на одном кандидате, несколько настораживает.
(deleted comment)

Date: 2020-11-07 10:04 pm (UTC)
From: [identity profile] kireev.livejournal.com
Нет, почтовое не один огромный участок.

И да, какой смысл имеет брать первую цифру для этого я не очень понял - последнюю же надо.
(deleted comment)

Date: 2020-11-07 10:16 pm (UTC)
From: [identity profile] kireev.livejournal.com
Да, но эти результаты все равно часть голосования этого участка. То есть в каждом участке такое-то голосов подано по почте и такое-то на самом участке.

Date: 2020-11-07 10:39 pm (UTC)
From: [identity profile] yaroslav-zh-k.livejournal.com
sevabashirov уже ответил по сути, это разумно для равномерно распределённых по логарифмическому основанию, здесь нет оснований для подобных предположений.

Date: 2020-11-07 10:44 pm (UTC)
From: [identity profile] sevabashirov.livejournal.com
Вот количество голосов не по участкам, а по округам (counties) подойдет, равно как подходит и само население округов - разброс в пять порядков.

Date: 2020-11-13 08:54 pm (UTC)
From: [identity profile] urease.livejournal.com
Удобнее и надёжнее брать распределение не первых, а последних цифр

Никто и никогда этого не делает. По Бенфорду иногда можно поймать, потому что распределение первой цифры - неюниформное, и если писать случайные числа получается юниформное распределение. Так и ловят.

В случае же последней цифры распределение и так юниформно. Как и у случайно сгенерированных чисел.

Я смотрел очень внимательно на распределение Бенфорда для 2016 года (Harvard Dataverse) и там тоже была очень "разоблачительная" картина: чем больше распределение сдвинуто в сторону демократов, тем более демократы "мухлюют". Если же взять, скажем Nassau County (где тоже больше 1000 пресинктов), то там обе партии примерно одинаково набирают, и соответственно отклонения от Бенфорда примерно одиноковые.

Я был бы рад найти мухлёж демократов - терпеть их не могу, но в Бенфорде его не увидеть (как правильно заметил Александр Шен).

Кстати где вы господа американцы берёте данные 2020? Есть ли данные по всем пресинктам?

Date: 2020-11-07 11:01 pm (UTC)
From: [identity profile] kireev.livejournal.com
Большое спасибо!

Date: 2020-11-07 11:06 pm (UTC)
From: [identity profile] blajer.livejournal.com
Спасибо.

Date: 2020-11-08 04:14 pm (UTC)
From: [identity profile] profpr.livejournal.com
Основное предположение здесь то, что закон Бенфорда применим к результатам этих выборов. Если это предположение верно, то я ожидал бы, что и распределение числа зарегистрированных избирателей подчиняется этому закону. Однако, взяв первый попавшийся каунти Allegheny county, PA, я вижу, что это абсолютно не так:

First# Count of Registered
1 189
2 74
3 87
4 151
5 227
6 237
7 163
8 126
9 69

Исходя из бимодального распределения, я бы предположил, что здесь присутствуют сельские и богатые загородные участки с малым числом избирателей, голосующие за Т, и inner city, с "оптимальным" числом избирателей, который за Б. Отсюда и разница в распределениях. Обобщая, я бы ожидал _в среднем_ то же самое различие в распределениях по США в целом. И еще: здесь и проявляется та самая география, которую вы считаете отсутствующей.

February 2026

S M T W T F S
1234567
891011 121314
15161718192021
22232425262728

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Feb. 27th, 2026 08:17 am
Powered by Dreamwidth Studios