90887 участков, 100655093 избирателей
Sep. 19th, 2016 04:35 pm![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
Вся Россия.
Оценки скорректированных результатов практически не поменяись, см. предыдущий пост.
Обновленные картинки по регионам в https://drive.google.com/open?id=0ByFMnU
Вся Россия.
Оценки скорректированных результатов практически не поменяись, см. предыдущий пост.
Обновленные картинки по регионам в https://drive.google.com/open?id=0ByFMnU
no subject
Date: 2016-09-19 01:45 pm (UTC)no subject
Date: 2016-09-19 06:27 pm (UTC)(no subject)
From:(no subject)
From:no subject
Date: 2016-09-19 11:46 pm (UTC)(no subject)
From:no subject
Date: 2016-09-19 03:10 pm (UTC)no subject
Date: 2016-09-19 03:35 pm (UTC)(no subject)
From:Препринт в "Архиве" как скоро могли бы обновить?
Date: 2016-09-19 03:30 pm (UTC)no subject
Date: 2016-09-19 06:19 pm (UTC)(no subject)
From:no subject
Date: 2016-09-19 03:48 pm (UTC)Чего там по Х и Y ?
no subject
Date: 2016-09-19 05:18 pm (UTC)Y - сумма голосов поданных за партии на участках с явкой, равной X
Красным заштрихована аномальная часть голосов за Едро, вываливающаяся из общего распределения голосов между партиями и предположительно относящаяся к вбросам или фальсифицированным протоколам УИК.
(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2016-09-19 04:24 pm (UTC)no subject
Date: 2016-09-19 09:37 pm (UTC)https://www.facebook.com/notes/dmitry-kogan/%D0%B3%D0%BE%D1%81%D0%B4%D1%83%D1%80%D0%B0-%D1%81%D0%BD%D0%BE%D0%B2%D0%B0-%D0%BD%D0%B5%D0%BB%D0%B5%D0%B3%D0%B8%D1%82%D0%B8%D0%BC%D0%BD%D0%B0/1752722271669039
(no subject)
From:no subject
Date: 2016-09-19 05:16 pm (UTC)no subject
Date: 2016-09-24 05:35 pm (UTC)Если участков с менее чем 100 избирателями мало, они и не влияют на вид графика, а если много, то их надо считать наравне.
(no subject)
From:no subject
Date: 2016-09-19 06:32 pm (UTC)no subject
Date: 2016-09-19 08:24 pm (UTC)Ссылка для связности: http://dmitrykogan.livejournal.com/204796.html
(no subject)
From:no subject
Date: 2016-09-19 07:04 pm (UTC)no subject
Date: 2016-09-19 07:55 pm (UTC)(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2016-09-19 09:32 pm (UTC)no subject
Date: 2016-09-19 09:52 pm (UTC)no subject
Date: 2016-09-20 06:11 pm (UTC)(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2016-09-20 01:49 am (UTC)Мне попалась интересная книжка Clojure for Data Science (Язык Clojure для науки о данных, 2015, Packt Publishing), чей перевод я безуспешно пытался разместить в одном из наших издательств. В ней первая глава посвящена основам математической статистики и распределениям вероятности на примере данных выборов в Великобритании 2010 г. и в РФ в 2011 г. На основе многочисленных графиков автор четко показывает, каким образом в РФ выборы были сфальсифицированы. Первую главу высылаю (надеюсь в Вашу копилку).
Вот ссылка на главу 1, Статистика:
https://www.dropbox.com/s/776km6gmdw6cw19/ClojureForDataScience_Statistics_2015.docx?dl=0
no subject
Date: 2016-09-20 09:46 pm (UTC)Но в приведенном Вами примере рассказано о методике, до которой автор сразу не додумался (все любят изобретать велосипед) - выполнении закона Бенфорда. Вот его выполнение/не выполнение будет маркером были фальсификации или нет. Я даже более того скажу. Им уже обсчитывали выборы на Украине, выборы в РФ в 2011 году (обнаружены фальсификации в некоторых регионах), выборы в США, в Албании (обнаружили фальсификации), Иране(обнаружили фальсификации) и т.д.
(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2016-09-20 09:30 am (UTC)Пля, что с людьми политические пристрастия делают, так ведь и таблицу умножения отменить недолго.
Да, привет от 101-й группы.))))
no subject
Date: 2016-09-20 07:18 pm (UTC)(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2016-09-20 10:00 am (UTC)no subject
Date: 2016-09-20 11:01 am (UTC)no subject
Date: 2016-09-20 03:06 pm (UTC)Цитата
"Представим распределение голосов за ЕР в виде: (все голоса за ЕР) = С * (голоса за все партии без ЕР) + (аномальная часть голосов за ЕР), где С – подгоночный коэффициент, подбираемый так, чтобы при невысоких явках (где, как говорилось выше, должны оставаться только «честные» участки) аномальная часть была по возможности близка к нулю."
Если можно, вопросы
1) предполагается, что в идеальном случае процент за партию власти, как и за остальные партии, не должен зависеть от явки
В качестве примера приводится Польша.
На чем еще основана эта гипотеза?
Ведь вполне может оказаться, что, например, процент за власть линейно растет от явки. Это соответствует гипотезе, что все протестные и так пришли, а провластные остались дома.
И количество дополнительно пришедших провластных - фактически заслуга местного избиркома и местной агитации прийти на выборы.
2) коэффициент С подбирается под кривую "за все остальные партии" по статистике "с малой явкой" - скорее всего используется метод наименьших квадратов по ограниченному диапазону
Скажите, какие границы диапазона используются для этого и почему?
3) Как известно, смесь двух гауссовских распределений с разными средними значениями в общем случае уже не является гауссовским.
Это вполне показывают "скорректированные графики" в целом по России - хвост хоть и меньше, но остается.
Поэтому, как я понял, производите коррекцию по каждому региону отдельно.
Но внутри одного региона тоже может быть сильная разница - скажем города и сельская местность, разные города.
Это возможная "местная добавка" в среднее значение голосов. Ее Вы никак не пробовали учитывать?
4) К сожалению я не понял, как в методике нормирования голосов используется динамика явки по часам. Никак?
5) Как в методике нормировки используются результаты по участкам, оснащенным КОИБами. Никак?
---
П.С. На всякий случай, я не про политику, мне интересна именно методика.
no subject
Date: 2016-09-20 09:27 pm (UTC)ЗЫ все это естественно не значит, что вбросов и фальсификаций не было. Были, этому есть вполне очевидные статистические свидетельства. Но вот конкретно этот автор, что сейчас, что 5 лет назад несет откровенную чушь, еще хорошо, если не врет сознательно, а просто от математической безграмотности.
(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2016-09-20 03:13 pm (UTC)И ещё, а кто-нибудь пытался высылать такие анализы понятно кому на местном уровне с вопросом, как это ?!
И пока не пойму где искать данные по каждой комиссии, участку?!
Вот например по одномандатникам, вижу есть некоторые вопросы, по одному из кандидатов, слишком например большое количество проголосовавших...вот здесь: ""http://www.ikhmao.ru/upload/iblock/e85/dxm_12.pdf""
всего лишь половина
Date: 2016-09-20 03:52 pm (UTC)ведь это самое важное
там 99% успех из 206 кандидатов победили 203
no subject
Date: 2016-09-20 06:39 pm (UTC)no subject
Date: 2016-09-20 09:00 pm (UTC)(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2016-09-20 11:55 pm (UTC)no subject
Date: 2016-09-21 08:31 pm (UTC)Пока у меня как у человека со стороны складывается впечатление, что никак не учитывает, зато наглядно демонстрирует :-)
no subject
Date: 2016-09-23 10:32 am (UTC)Постарался минимум политики, максимум статистического анализа.
У меня получилось, что для нашего региона эту методику использовать нельзя.
Основная причина: пик распределения - голоса городских жителей. "Высокий хвост распределения" - голоса сельских жителей.
И они голосуют существенно по разному. Поэтому по голосованию городских нельзя аппроксимировать хвост распределения (голоса сельских).
Кроме того, все мы забываем, что при приблизительно одинаковой одинаковой нарезке УИК по числу голосующих:
Пусть x – явка, y(x) – Число голосов за ЕР как функция от явки, z(x) – Число голосов против ЕР как функция от явки, а K- Количество бюллетеней на участке.
Тогда z(x)+y(x)=K*x - уже существует простая линейная зависимость между функциями, а значит выявляемые "аномалии" могут быть обусловлены не голосованием, а разной нарезкой.
Для города Самары выполнено дополнительное исследование на картах.
Ссылка на результаты исследования https://yadi.sk/i/17p-7p9_vYzNb
Там же ссылка на Эксель-файл.
no subject
Date: 2016-09-23 09:39 pm (UTC)Мысль правильная, но итоговая оценка вброса от этого слабо изменится, насколько я вижу.
Сколько голосов в правой части графика для сельской местности (>60% на рис.8)? Т.е. интеграл от разницы двух кривых ("за ЕР" - "все кроме ЕР"). Оценка Шпилькина по всей Самарской области (в верхнем левом углу) - 183 тысячи голосов.
выявляемые "аномалии" могут быть обусловлены не голосованием, а разной нарезкой.
Можете пояснить подробнее? Каким образом нарезка влияет на явку и на появление корреляции между явкой и результатом ЕР?
(no subject)
From:(no subject)
From:no subject
Date: 2016-10-08 05:59 pm (UTC)