podmoskovnik: (mill)
[personal profile] podmoskovnik

Вся Россия.
Оценки скорректированных результатов практически не поменяись, см. предыдущий пост.

Обновленные картинки по регионам в https://drive.google.com/open?id=0ByFMnUnpIlriNmhaUlZoUFJteDA

(теперь в разрешении 600 dpi)

Date: 2016-09-19 01:45 pm (UTC)
From: [identity profile] abbys.livejournal.com
можно по Троицку отдельно?

Date: 2016-09-19 06:27 pm (UTC)
From: [identity profile] iratn81.livejournal.com
молодой человек-в троицке г. москвы легко сделаете сами-на сайте цик есть строчка сверху слева печать что ли-и там скачиваете в екселе -закачаете и сделаете результаты голосования за ЕР от явки хотя бы. 17 участков там всего что ли.

(no subject)

From: [identity profile] lehatut.livejournal.com - Date: 2016-09-19 09:42 pm (UTC) - Expand

(no subject)

From: [identity profile] travalliero.livejournal.com - Date: 2016-09-19 11:45 pm (UTC) - Expand

Date: 2016-09-19 11:46 pm (UTC)
From: [identity profile] travalliero.livejournal.com
http://www.vybory.izbirkom.ru/region/izbirkom?action=show&global=true&root=772000054&tvd=27720001659737&vrn=100100067795849&prver=0&pronetvd=0®ion=77&sub_region=77&type=453&vibid=27720001659737

(no subject)

From: [identity profile] iratn81.livejournal.com - Date: 2016-09-20 11:22 am (UTC) - Expand

Date: 2016-09-19 03:10 pm (UTC)
From: [identity profile] vakhnenko.livejournal.com
А вы не подскажете, есть уже где-то в интернете excel или там csv файл с явкой, голосами и всем таким прочим по всем УИКам страны? Если нет, то когда он появится и где его искать? Я тоже хотел бы глянуть в матлабе что там и как, но самостоятельно вытянуть эту информацию с сайта центризберкома не смогу.

Date: 2016-09-19 06:19 pm (UTC)
From: [identity profile] kobak.livejournal.com
Это уже не препринт, а финальная версия напечатанной статьи, вот этой: https://projecteuclid.org/euclid.aoas/1458909907. Так что обновляться он не будет.
Edited Date: 2016-09-19 06:20 pm (UTC)

(no subject)

From: [identity profile] ain92.livejournal.com - Date: 2016-09-20 05:17 pm (UTC) - Expand

Date: 2016-09-19 03:48 pm (UTC)
From: [identity profile] alex (from livejournal.com)
Подскажите плиз как читать график ?
Чего там по Х и Y ?

Date: 2016-09-19 05:18 pm (UTC)
From: [identity profile] dikem.livejournal.com
Х - процент явки по участкам
Y - сумма голосов поданных за партии на участках с явкой, равной X

Красным заштрихована аномальная часть голосов за Едро, вываливающаяся из общего распределения голосов между партиями и предположительно относящаяся к вбросам или фальсифицированным протоколам УИК.
Edited Date: 2016-09-19 05:20 pm (UTC)

(no subject)

From: [identity profile] sergey brener - Date: 2016-09-20 05:25 pm (UTC) - Expand

(no subject)

From: [identity profile] iratn81.livejournal.com - Date: 2016-09-19 06:26 pm (UTC) - Expand

(no subject)

From: [identity profile] katyat.livejournal.com - Date: 2016-09-20 01:30 pm (UTC) - Expand

(no subject)

From: [identity profile] sergey brener - Date: 2016-09-20 05:26 pm (UTC) - Expand

Date: 2016-09-19 04:24 pm (UTC)
From: [identity profile] luboznatel.livejournal.com
Не могли бы вы составить некий Индекс грязности выборов, посчитав долю приписанных голосов в общем числе. Чтобы понять какие регионы самые грязные и какие самые чистые.

Date: 2016-09-19 09:37 pm (UTC)
From: [identity profile] purgenetik.livejournal.com
Смотри тут рейтинг регионов по убыванию фальсификаций по явке (вторая таблица):
https://www.facebook.com/notes/dmitry-kogan/%D0%B3%D0%BE%D1%81%D0%B4%D1%83%D1%80%D0%B0-%D1%81%D0%BD%D0%BE%D0%B2%D0%B0-%D0%BD%D0%B5%D0%BB%D0%B5%D0%B3%D0%B8%D1%82%D0%B8%D0%BC%D0%BD%D0%B0/1752722271669039

(no subject)

From: [identity profile] ain92.livejournal.com - Date: 2016-09-20 05:21 pm (UTC) - Expand

Date: 2016-09-19 05:16 pm (UTC)
From: [identity profile] st-op.livejournal.com
скажите, пожалуйста, если убрать из выборки участки с менее чем 100 проголосовавшими, картина та же?

Date: 2016-09-24 05:35 pm (UTC)
From: [identity profile] oblik0m0rale.livejournal.com
А какое значение имеет величина участка, если по оси Y не число участков, а число голосов?

Если участков с менее чем 100 избирателями мало, они и не влияют на вид графика, а если много, то их надо считать наравне.

(no subject)

From: [identity profile] st-op.livejournal.com - Date: 2016-09-25 01:44 am (UTC) - Expand

Date: 2016-09-19 06:32 pm (UTC)
From: [identity profile] dmitrykogan.livejournal.com
У меня на этот раз оценка помягче - у ЕР ~42, явка ~38

Date: 2016-09-19 08:24 pm (UTC)
From: [identity profile] kobak.livejournal.com
Да, если считать по регионам, то всегда поменьше получается.

Ссылка для связности: http://dmitrykogan.livejournal.com/204796.html

(no subject)

From: [identity profile] dmitrykogan.livejournal.com - Date: 2016-09-19 08:33 pm (UTC) - Expand

Date: 2016-09-19 07:04 pm (UTC)
From: [identity profile] goliafffff.livejournal.com
Чем объясняется пик на 0.5?

Date: 2016-09-19 07:55 pm (UTC)
From: [identity profile] purgenetik.livejournal.com
Часть особо преданных руководителей УИК уж очень хотела угодить ЕР, нарисовав красивые числа за ЕР: 50, 60,85 процентов голосов - наиболее красивые пики вылезли. Вот такая медвежья услуга.

(no subject)

From: [identity profile] hyperpov.livejournal.com - Date: 2016-09-19 09:31 pm (UTC) - Expand

(no subject)

From: [identity profile] nonenoun.livejournal.com - Date: 2016-09-21 12:14 am (UTC) - Expand

(no subject)

From: [identity profile] hyperpov.livejournal.com - Date: 2016-09-21 03:20 pm (UTC) - Expand

(no subject)

From: [identity profile] nonenoun.livejournal.com - Date: 2016-09-22 07:49 pm (UTC) - Expand

(no subject)

From: [identity profile] hyperpov.livejournal.com - Date: 2016-09-23 04:27 pm (UTC) - Expand

(no subject)

From: [identity profile] prezj-vsegor.livejournal.com - Date: 2016-09-20 04:46 pm (UTC) - Expand

(no subject)

From: [identity profile] nonenoun.livejournal.com - Date: 2016-09-21 12:12 am (UTC) - Expand

Date: 2016-09-19 09:32 pm (UTC)
From: [identity profile] ammosov.livejournal.com
А датасет где и как берете?

Date: 2016-09-19 09:52 pm (UTC)
From: [identity profile] Денис Витман (from livejournal.com)
В общем стало интересно, полез проверять. Взял город "Уфа". Разброс явки - от 24% до 100%. Всего 177 чисто городских участков. Взял первые 50 по явке участков и последние 50. Сравнил средний результат за Едро. Участки с высокой явкой - 52%, с низкой - 49%. Вот эти 3% - это и есть результат "прямого" админдавления - вбросы, подтасовки, карусели, и "строем марш голосовать".

Date: 2016-09-20 06:11 pm (UTC)
From: [identity profile] mudasobwa.livejournal.com
Всего участков 101%. Годная аналитика, продолжайте в том же духе.

(no subject)

From: [identity profile] Денис Витман - Date: 2016-09-20 06:43 pm (UTC) - Expand

(no subject)

From: [identity profile] mudasobwa.livejournal.com - Date: 2016-09-20 06:48 pm (UTC) - Expand

(no subject)

From: [identity profile] oblik0m0rale.livejournal.com - Date: 2016-09-24 05:42 pm (UTC) - Expand

Date: 2016-09-20 01:49 am (UTC)
From: [identity profile] Андрей Логунов (from livejournal.com)
Это дубль сообщения в более раннем посте (не знаю прошло или нет, удалите если что).

Мне попалась интересная книжка Clojure for Data Science (Язык Clojure для науки о данных, 2015, Packt Publishing), чей перевод я безуспешно пытался разместить в одном из наших издательств. В ней первая глава посвящена основам математической статистики и распределениям вероятности на примере данных выборов в Великобритании 2010 г. и в РФ в 2011 г. На основе многочисленных графиков автор четко показывает, каким образом в РФ выборы были сфальсифицированы. Первую главу высылаю (надеюсь в Вашу копилку).

Вот ссылка на главу 1, Статистика:
https://www.dropbox.com/s/776km6gmdw6cw19/ClojureForDataScience_Statistics_2015.docx?dl=0

Date: 2016-09-20 09:46 pm (UTC)
From: [identity profile] vadim krasnobelmov (from livejournal.com)
Забавно. В другой британской книжке я встречал иное утверждение, что все эти выборы демонстрируют именно мультимодальные распределения (т.е. никакого идеального колокола не будет видно), и не только в ней.
Но в приведенном Вами примере рассказано о методике, до которой автор сразу не додумался (все любят изобретать велосипед) - выполнении закона Бенфорда. Вот его выполнение/не выполнение будет маркером были фальсификации или нет. Я даже более того скажу. Им уже обсчитывали выборы на Украине, выборы в РФ в 2011 году (обнаружены фальсификации в некоторых регионах), выборы в США, в Албании (обнаружили фальсификации), Иране(обнаружили фальсификации) и т.д.

(no subject)

From: [identity profile] eddie-blackarch.livejournal.com - Date: 2016-09-21 06:19 am (UTC) - Expand

(no subject)

From: [identity profile] vadim krasnobelmov - Date: 2016-09-21 05:15 pm (UTC) - Expand

(no subject)

From: [identity profile] vadim krasnobelmov - Date: 2016-09-22 07:46 pm (UTC) - Expand

(no subject)

From: [identity profile] nonenoun.livejournal.com - Date: 2016-09-22 08:19 pm (UTC) - Expand

(no subject)

From: [identity profile] vadim krasnobelmov - Date: 2016-09-23 12:42 am (UTC) - Expand

(no subject)

From: [identity profile] nonenoun.livejournal.com - Date: 2016-09-23 02:08 am (UTC) - Expand

(no subject)

From: [identity profile] eddie-blackarch.livejournal.com - Date: 2016-09-23 10:14 am (UTC) - Expand

(no subject)

From: [identity profile] Андрей Логунов - Date: 2016-12-02 01:34 pm (UTC) - Expand

Date: 2016-09-20 09:30 am (UTC)
From: [identity profile] andrey-lub.livejournal.com
Серёж, ты бы не позорил ни физфак, ни наш курс такими безумными исследованиями. И хотя бы максвелла с гауссом не путал.)))
Пля, что с людьми политические пристрастия делают, так ведь и таблицу умножения отменить недолго.
Да, привет от 101-й группы.))))

Date: 2016-09-20 07:18 pm (UTC)
From: [identity profile] dmk-blog.livejournal.com
Идея совершенно правильная - соотнести гауссово распределение с фактическим, но процент липовых голосов он рассчитал не правильно. Их еще больше, если учесть, что заказ был не просто на ЕдРо, но за соотношение ЕдРа, КПРФ, ЛДПР и СР - пики на 0,50 и далее свидетельствуют об этом. Пик на 1,00 говорит только о том, что оставшиеся после голосования бюллетени заполняли работники УИКов примерно по этому же соотношению + какое-то мизерное количество за остальные партии, чтобы все было более-менее правдоподобно..
Edited Date: 2016-09-20 07:23 pm (UTC)

(no subject)

From: [identity profile] vadim krasnobelmov - Date: 2016-09-20 10:58 pm (UTC) - Expand

(no subject)

From: [identity profile] vm-lj.livejournal.com - Date: 2016-09-20 08:58 pm (UTC) - Expand

(no subject)

From: [identity profile] physlitso.livejournal.com - Date: 2016-10-18 06:20 pm (UTC) - Expand

(no subject)

From: [identity profile] vadim krasnobelmov - Date: 2016-09-20 09:40 pm (UTC) - Expand

(no subject)

From: [identity profile] nonenoun.livejournal.com - Date: 2016-09-21 12:22 am (UTC) - Expand

(no subject)

From: [identity profile] vadim krasnobelmov - Date: 2016-09-21 09:25 pm (UTC) - Expand

(no subject)

From: [identity profile] shultz-flory.livejournal.com - Date: 2016-09-22 10:07 am (UTC) - Expand

(no subject)

From: [identity profile] vadim krasnobelmov - Date: 2016-09-22 07:31 pm (UTC) - Expand

(no subject)

From: [identity profile] shultz-flory.livejournal.com - Date: 2016-09-22 07:56 pm (UTC) - Expand

(no subject)

From: [identity profile] vadim krasnobelmov - Date: 2016-09-23 12:45 am (UTC) - Expand

(no subject)

From: [identity profile] shultz-flory.livejournal.com - Date: 2016-09-23 05:08 am (UTC) - Expand

(no subject)

From: [identity profile] nonenoun.livejournal.com - Date: 2016-09-22 08:10 pm (UTC) - Expand

(no subject)

From: [identity profile] vadim krasnobelmov - Date: 2016-09-23 12:50 am (UTC) - Expand

(no subject)

From: [identity profile] nonenoun.livejournal.com - Date: 2016-09-23 02:01 am (UTC) - Expand

Date: 2016-09-20 10:00 am (UTC)
From: [identity profile] in-kant.livejournal.com
Скажите, а коэффициент 0,674 был выбран "на глазок", чтобы левый край распределения более-менее совпадал, или это какое-то фиттирование? Просто сейчас получается, что на всех участках с явкой меньше 36% "коррекция" проведена во вред результатам ЕР. Насколько "физична" такая гипотеза? Не следует ли уменьшить коэффициент, чтобы выполнялось условие КоррекцияЕР ≥ 0 для каждого бина?

Date: 2016-09-20 11:01 am (UTC)
From: [identity profile] bigdye (from livejournal.com)
Нужно сделать контраст город (обычно низкая явка) против деревни/села (высокая явка часто) в каждом более или менее крупном и мениально однородном регионе. А так это все - мешанина

Date: 2016-09-20 03:06 pm (UTC)
From: [identity profile] andreichernov.livejournal.com
Посмотрел Вашу методику в закрепленном посте
Цитата
"Представим распределение голосов за ЕР в виде: (все голоса за ЕР) = С * (голоса за все партии без ЕР) + (аномальная часть голосов за ЕР), где С – подгоночный коэффициент, подбираемый так, чтобы при невысоких явках (где, как говорилось выше, должны оставаться только «честные» участки) аномальная часть была по возможности близка к нулю."

Если можно, вопросы
1) предполагается, что в идеальном случае процент за партию власти, как и за остальные партии, не должен зависеть от явки
В качестве примера приводится Польша.
На чем еще основана эта гипотеза?
Ведь вполне может оказаться, что, например, процент за власть линейно растет от явки. Это соответствует гипотезе, что все протестные и так пришли, а провластные остались дома.
И количество дополнительно пришедших провластных - фактически заслуга местного избиркома и местной агитации прийти на выборы.

2) коэффициент С подбирается под кривую "за все остальные партии" по статистике "с малой явкой" - скорее всего используется метод наименьших квадратов по ограниченному диапазону
Скажите, какие границы диапазона используются для этого и почему?

3) Как известно, смесь двух гауссовских распределений с разными средними значениями в общем случае уже не является гауссовским.
Это вполне показывают "скорректированные графики" в целом по России - хвост хоть и меньше, но остается.
Поэтому, как я понял, производите коррекцию по каждому региону отдельно.
Но внутри одного региона тоже может быть сильная разница - скажем города и сельская местность, разные города.
Это возможная "местная добавка" в среднее значение голосов. Ее Вы никак не пробовали учитывать?

4) К сожалению я не понял, как в методике нормирования голосов используется динамика явки по часам. Никак?

5) Как в методике нормировки используются результаты по участкам, оснащенным КОИБами. Никак?
---
П.С. На всякий случай, я не про политику, мне интересна именно методика.

Date: 2016-09-20 09:27 pm (UTC)
From: [identity profile] sergey brener (from livejournal.com)
вопросы правильные. Ответ - никак не учитывается. Про города и села - очевидная вещь, которую уж точно надо учесть. Подсчет "вбросов" вроде вообще проведен не по каждому региону отдельно, а по графику для всей России, т.е. еще и различия между разными регионами напрочь игнорируются.

ЗЫ все это естественно не значит, что вбросов и фальсификаций не было. Были, этому есть вполне очевидные статистические свидетельства. Но вот конкретно этот автор, что сейчас, что 5 лет назад несет откровенную чушь, еще хорошо, если не врет сознательно, а просто от математической безграмотности.

(no subject)

From: [identity profile] vadim krasnobelmov - Date: 2016-09-20 11:58 pm (UTC) - Expand

(no subject)

From: [identity profile] nonenoun.livejournal.com - Date: 2016-09-21 12:33 am (UTC) - Expand

(no subject)

From: [identity profile] vadim krasnobelmov - Date: 2016-09-21 08:28 pm (UTC) - Expand

(no subject)

From: [identity profile] nonenoun.livejournal.com - Date: 2016-09-22 07:58 pm (UTC) - Expand

(no subject)

From: [identity profile] vadim krasnobelmov - Date: 2016-09-23 12:19 am (UTC) - Expand

(no subject)

From: [identity profile] nonenoun.livejournal.com - Date: 2016-09-23 02:24 am (UTC) - Expand

Date: 2016-09-20 03:13 pm (UTC)
From: [identity profile] long-wire.livejournal.com
А вот такой вопрос... А как это соотнести с голосованием по одномондтникам?! Принцип такой же? Как выяснить, источник проблемы, а если условия исходные были одинаковы, и одинаково делали результат, то есть все комиссии были подвержены, влиянию третьих лиц и одинаково, как это выявить?!
И ещё, а кто-нибудь пытался высылать такие анализы понятно кому на местном уровне с вопросом, как это ?!
И пока не пойму где искать данные по каждой комиссии, участку?!

Вот например по одномандатникам, вижу есть некоторые вопросы, по одному из кандидатов, слишком например большое количество проголосовавших...вот здесь: ""http://www.ikhmao.ru/upload/iblock/e85/dxm_12.pdf""
Edited Date: 2016-09-20 03:15 pm (UTC)

всего лишь половина

Date: 2016-09-20 03:52 pm (UTC)
From: [identity profile] 1234 4321 (from livejournal.com)
А одномандатные округа вас не интересуют?
ведь это самое важное
там 99% успех из 206 кандидатов победили 203

Date: 2016-09-20 06:39 pm (UTC)
From: [identity profile] dmk-blog.livejournal.com
Пики, начиная с 0,50 - это откровенные вбросы за ЕР, КПРФ, ЛДПР и СР (соотношение озвучено главой избиркома Крыма по "фальшивому" письму: 60% за ЕР, 10% за КПРФ и 15% за ЛДПР, в письмах в других регионах, видно, присутствовала и СР). Extra votes рассчитаны неправильно. Пересчитайте в целом по ЕР, КПРФ, ЛДПР и СР - заказ был именно на эти 4 партии и синхронность пиков на 0,50 и 0,95 говорят именно об этом. И поэтому Others и All except EdRo - не актуальны, уберите их вообще. И надо бы более подробный график, чтобы осмыслить характер пика на 0,50
Edited Date: 2016-09-20 07:10 pm (UTC)

Date: 2016-09-20 09:00 pm (UTC)
From: [identity profile] vm-lj.livejournal.com
а где можно фальшивое письмо прочитать?

(no subject)

From: [identity profile] vadim krasnobelmov - Date: 2016-09-21 08:31 pm (UTC) - Expand

(no subject)

From: [identity profile] dmk-blog.livejournal.com - Date: 2016-09-26 03:56 pm (UTC) - Expand

(no subject)

From: [identity profile] vm-lj.livejournal.com - Date: 2016-09-26 09:08 pm (UTC) - Expand

Date: 2016-09-20 11:55 pm (UTC)
From: [identity profile] Иван Шмаков (from livejournal.com)
Вопрос: как данная методология географическую распределенность плотность численности населения?

Image

Date: 2016-09-21 08:31 pm (UTC)
From: [identity profile] vadim krasnobelmov (from livejournal.com)
Вы хотели написать "учитывает"?

Пока у меня как у человека со стороны складывается впечатление, что никак не учитывает, зато наглядно демонстрирует :-)

Date: 2016-09-23 10:32 am (UTC)
From: [identity profile] andreichernov.livejournal.com
Коллеги, я выполнил более подробные исследования по методике Сергея для Самарской области.
Постарался минимум политики, максимум статистического анализа.
У меня получилось, что для нашего региона эту методику использовать нельзя.

Основная причина: пик распределения - голоса городских жителей. "Высокий хвост распределения" - голоса сельских жителей.
И они голосуют существенно по разному. Поэтому по голосованию городских нельзя аппроксимировать хвост распределения (голоса сельских).

Кроме того, все мы забываем, что при приблизительно одинаковой одинаковой нарезке УИК по числу голосующих:
Пусть x – явка, y(x) – Число голосов за ЕР как функция от явки, z(x) – Число голосов против ЕР как функция от явки, а K- Количество бюллетеней на участке.
Тогда z(x)+y(x)=K*x - уже существует простая линейная зависимость между функциями, а значит выявляемые "аномалии" могут быть обусловлены не голосованием, а разной нарезкой.

Для города Самары выполнено дополнительное исследование на картах.

Ссылка на результаты исследования https://yadi.sk/i/17p-7p9_vYzNb
Там же ссылка на Эксель-файл.

Date: 2016-09-23 09:39 pm (UTC)
From: [identity profile] nonenoun.livejournal.com
Поэтому по голосованию городских нельзя аппроксимировать хвост распределения
Мысль правильная, но итоговая оценка вброса от этого слабо изменится, насколько я вижу.
Сколько голосов в правой части графика для сельской местности (>60% на рис.8)? Т.е. интеграл от разницы двух кривых ("за ЕР" - "все кроме ЕР"). Оценка Шпилькина по всей Самарской области (в верхнем левом углу) - 183 тысячи голосов.

выявляемые "аномалии" могут быть обусловлены не голосованием, а разной нарезкой.
Можете пояснить подробнее? Каким образом нарезка влияет на явку и на появление корреляции между явкой и результатом ЕР?

(no subject)

From: [identity profile] podmoskovnik.livejournal.com - Date: 2016-10-03 01:53 pm (UTC) - Expand

(no subject)

From: [identity profile] andreichernov.livejournal.com - Date: 2016-10-04 12:32 pm (UTC) - Expand

Date: 2016-10-08 05:59 pm (UTC)
From: [identity profile] tov-y.livejournal.com
Здесь очень уместны были бы пояснения того обстоятельства, что суммарно по регионам вброшено только 7,7 млн голосов, а для страны в целом – 12,1 млн.

Profile

podmoskovnik: (Default)
podmoskovnik

November 2016

S M T W T F S
  12345
6789101112
13141516171819
2021 2223242526
27282930   

Style Credit

Expand Cut Tags

No cut tags
Page generated Sep. 25th, 2017 08:23 pm
Powered by Dreamwidth Studios