podmoskovnik: (mill)

Выложил в https://datahub.io/organization/ru_elections имеющиеся у меня массивы данных по прошлым федеральным выборам (начиная с 1999 года).
Среди прочего, там есть свежая привязка 17 миллионов (условно, с некоторыми оговорками, - всех) адресов жилых домов в России к избирательным участкам.

Для обсуждения этих данных и смежных вопросов организована фейсбучная группа https://www.facebook.com/groups/327793607610593/. Если хотите вступить - стучитесь;

Данные открыты для всех, неучастие в группе никак не препятствует их использованию.

Данные будут по возможности дублироваться в https://hubofdata.ru/organization/russian-election-data

podmoskovnik: (mill)
На предстоящих осенью 2014 года выборах депутатов в Московскую городскую думу голосование будет проходить по новой схеме, по 45 одномандатным округам. Однако границы этих округов до сих пор не объявлены и, вероятно, будут определяться с учетом интересов кандидатов власти (см., например, http://abuzin.livejournal.com/135380.html). Избирателям и независимым кандидатам расскажут о границах округов за четыре месяца до выборов, а не за шесть, как полагалось раньше. И действительно, зачем нам это?

Аркадий Любарев предположил в ФБ, что будущие кандидаты власти на самом деле уже определены, и их можно выявить, внимательно читая районные московские газеты: если чьей-то деятельности уделяется непропорционально большое внимание в районной газете, то это, возможно, и есть будущий кандидат в Мосгордуму от соответствующего района.
Суммируя информацию, также, возможно, удастся определить границы избирательных округов.

В связи с этим появилась идея собрать такие сведения путем аутсорсинга (как собирались данные о расположении КОИБов на выборах 2011 и 2012 гг).

Если вы заметили в каком-либо московском районе необычно интенсивное медийное освещение какого-либо персонажа и считаете, что это может быть связано с его предстоящим выдвижением в Мосгордуму, заполните, пожалуйста, эту форму.
Текущие результаты можно посмотреть по этой ссылке

Также можно добавлять информацию в комментариях к этому посту.
podmoskovnik: (mill)
Это мои две копейки в дискуссию о результатах выборов мэра Москвы, начавшуюся с этого поста [livejournal.com profile] oude_rus и продолженную [livejournal.com profile] romanik'ом здесь и здесь. Название поста преследует исключительно художественные цели.
дальше очень длинно )
podmoskovnik: (mill)
Originally posted by [livejournal.com profile] eugenyboger at Традиционные графики по выборам мэра Москвы 8 сентября 2013 г.
Последние данные ЦИК по 3595 участкам.


  1. Самая интересная картинка: гистограмма распределения процента за Собянина, взвешенная на размер участка (графа 1 в протоколе). Если совсем просто, то для каждого значения процента за Собянина (ось X) по оси Y отложена общее списочное количество избирателей на участках, на которых получился соответствующий результат. Такое взвешивание позволяет корректно учитывать абсолютное влияние возможных фальсификаций, а так же исключить артефакты деления от маленьких чисел.
    Процент здесь и далее посчитан стандартным способом, используя общее количество найденных в урнах бюллетеней.

    Фит распределением гаусса.



    Выводы: гистограмма процента за Собянина просто прекрасно описывается нормальным распределением. Исключение составляет участок у правого хвоста распределения, где можно заметить превышение уровня над ожидаемым распределением. Т.к. гаусс - распределение симметричное и данные им неплохо описываются, то наиболее вероятное значение процента за Собянина приблизительно соответствует искомому среднему.

    Среднее значение модели в правом верхнем углу графика, находится в районе 51.0%. Значение очень незначительно меняется (сотые процента), если выкидывать из рассмотрения данные в районе подозрительного выброса справа (напомню, что это не означает исключения комиссий с большим процентом за Собянина из подсчёта результатов, они лишь не участвуют в построении модели, которая неплохо строится и по остальным данным).

    Объём фальсификаций в подсчёте итогов голосования, если они встречались локально, не превышает 0.5% по предварительной оценке.


  2. Взвешенное распределение явки, фит гауссом.


    Почти то же самое: незначительно превышение справа на хвосте.


  3. Двумерная взвешенная гисторамма: процент за Собянина от явки.



    Выводы: выглядит прилично, видна отрицательная корреляция процента за Собянина и явки. Чем больше приходило людей на участки, тем хуже был результат Собянина . Что подтверждает печальный факт: не все противники действующей власти были мобилизованы на выборы.
    Коэффициент корреляции в центральном регионе: -0.28.


  4. Фит слайсов (оно же profile) предыдущей картинки. Простыми словами: для каждого значения явки была построена гистограмма распределения процента голосов за Собянина. Эта гисторамма была зафитирована распределением гаусса. Среднее значение, получившееся в такого фита, отложено по оси Y.

    Красная линия - фит центрального региона прямой. Коэффициенты справа.

    Выводы: Угловой коэффициент -0.8 как бы намекает на масштаб эффекта.



Все данные, скрипты и картинки в репозитории https://github.com/evgeny-boger/rus-elections-stats/

Важный вывод из всего этого: товарищи эксперты, утверждавшие, что нормальное распределение не применимо для описания выборов вообще, российских выборов, московских выборов и т.д. очевидно окончательно оказались неправы. Именно так должны выглядеть графики для честных результатов голосования, хотя бы в масштабе одного региона. Стоит ли говорить, что на президентских и думских выборах всё выглядело немного не так.
podmoskovnik: (mill)
В порядке праздного интереса. Гистограмма числа участков (взвешенная по численности избирателей) в зависимости от отношения голосов Навальный/Собянин.
Отдельно для участков, где есть данные СМС-ЦИК, и для участков, где нет.
На участках, где данные СМС-ЦИК есть, среднее отношение Навальный/Собянин заметно выше. Есть такие, где у Н больше, чем у С. На участках без данных СМС-ЦИК побед Навального над Собяниным почти нет.
Вопрос, что это - социологический сдвиг в расстановке наблюдателей или результат манипуляций.Nav_to_Sob_sms_vs_wosms-09_Sep_2013_23_17
podmoskovnik: (mill)
Как известно, в Москве перед выборами пропало 125 тысяч избирателей

Хорошая новость: они вернулись. Не все, но многие.
По данным об открытии избирательных участков в списках было 7169071 избирателей.
А согласно текущим результатам на сайте МГИК, в списках по итогам голосования значится 7250879 избирателей
Итого списочный состав увеличился на 81808 человека, или на 1.14%. Что бы это ни значило.
podmoskovnik: (mill)
Как указали [livejournal.com profile] sciencewriter и [livejournal.com profile] tov_y, в скачанных данных МГИК отсутствуют 14 участков в Щербинке (3356-3369). Пока картинки без них. UPD на самом деле все участки на месте, но впоследствии произошло обновление данных на небольшом количестве участков.
Гистограммы по данным МГИК отдельно для участков, где есть данные SMS-ЦИК (2002 участка без нарушений контрольных соотношений) и для тех, где нет.
Понятно, что распределение наблюдателей может быть сдвинуто относительно среднего, надо смотреть подробнее.

UPD результаты кандидатов по показанным выборкам:

Участки с SMS-ЦИК

Участки без SMS-ЦИК

Избиратели

4.22 млн

3.03 млн

Собянин

49.97%

53.33%

Навальный

28.41%

25.62%


hist_sms_vs_wosms-09_Sep_2013_12_24
podmoskovnik: (mill)
На сайте МГИК появились данные по 3597 участкам. Видимо, это окончательные.
UPD: Расхождения с данными SMS-ЦИК, там где они есть, по-прежнему минимальные: по числу голосов за Собянина и Навального - всего 12 участков (возможно, есть отклонения по к-л другим графам, не проверял).
Гистограммы по результатам кандидатов (пунктир - данные SMS-ЦИК):
UPD: данные не окончательные, произошло еще одно обновление в нескольких участках.
hist_sms_09_Sep_2013_11_38
podmoskovnik: (mill)
Сравнил данные СМС-ЦИК и МГИК, на основе которых построены гистограммы
http://podmoskovnik.livejournal.com/169316.html
Мораль: расхождения практически полностью обусловлены разными наборами участков.
Из участков, которые есть в обоих наборах, результаты Навального и Собянина различаются только на 8:
Район УИК КОИБ Собянин МГИК Собянин СМС-ЦИК Навальный МГИК Навальный СМС-ЦИК

Бескудниковский район 236 УИК №236 428 429 181 181

Тимирязевский район 425 УИК №425 349 348 217 217

район Северное Медведково 791 УИК №791 382 315 168 202

район Печатники 1567 УИК №1567 1 342 403 128 146

Обручевский район 2292 УИК №2292 330 295 226 229

район Ясенево 2518 УИК №2518 346 347 178 178

Можайский район 2631 УИК №2631 309 338 170 172

район Митино 2945 УИК №2945 297 298 204 203

Остальное - расхождение выборки.
В частности, МГИК до сих пор не выдал данные по 391 участку с КОИБ!
Это означает, что:
1. СМС-ЦИК работает хорошо и точно.
2. Битва за результат будет происходить на тех участках, по которым до сих пор нет данных МГИК.
podmoskovnik: (mill)
UPD: подтянулись свежие данные МГИК (2564 участка, 5,0 млн избирателей).
Объемы у обоих источников примерно одинаковые, но результаты кандидатов разные (см. следующий пост).
Теперь сводная картинка выглядит так:
hist_sms_09_Sep_2013_03_12

Гистограммы по результатам кандидатов по данным SMS-ЦИК (2620 участков, 5.3 млн избирателей в списке)
Источник: https://docs.google.com/spreadsheet/pub?key=0Au8Fqk6C_bBOdEl4eHZrNWw3VFhkUEZuUGFVQlhyc1E&single=true&gid=0&output=html (via romanik)
Пунктиром - результаты по самым свежим данным МГИК (на 1:04 мск)
hist_sms_09_Sep_2013_02_48
podmoskovnik: (mill)
UPD2: о, данные поперли. 01:04, 1286 участков, 2,3 млн избирателей
01_04

UPD: данные на 00:51, 784 участка, 1,33 млн избирателей
00_51

МГИК в 21:50 опубликовал на сайте результаты по 80 тыс. избирателей (240 участков, из них много закрытых) и замер.
Гистограмма распределения участков по результатам кандидатов (С, Н и остальные в сумме), взвешенная по численности зарегистрированных избирателей, пока выглядит так (бин 1%):
22_48
podmoskovnik: (mill)
Участки с численностью избирателей более 1000, не закрытые:





Район УИК КОИБ Численность
избирателей
10:00 12:00 15:00 18:00 Описание
район Лефортово УИК №1391 1 2061 0.1247 0.2165 0.38 0.6639 ГОУ СОШ №417
Хорошевский район УИК №469 2998 0.0797 0.1815 0.3412 0.5524 Центр образования №1865, 2 этаж, холл
Новомосковский административный округ УИК №3329 1231 0.0341 0.0341 0.3046 0.528 ГБОУ СОШ № 2065
район Хамовники УИК №168 1 1524 0.0799 0.2333 0.4151 0.4974 ОАО "Росстройэкспо на Фрунзенской", павильон
Даниловский район УИК №1763 1 1448 0.0104 0.0601 0.163 0.4696 КЦ "ЗИЛ"
район Чертаново Южное УИК №2114 1 1651 0.1012 0.2829 0.3692 0.4489 ГБОУ ЦО № 504 "Полюс"
Даниловский район УИК №1756 1 1081 0.0083 0.0352 0.1018 0.4487 лицей № 1553
район Матушкино УИК №3229 1252 0.0256 0.1038 0.281 0.4485 ГБОУ СОШ № 618, 1 этаж Рекреация, левая сторона
Новомосковский административный округ УИК №3368 1 1973 0.0355 0.1216 0.3016 0.4415 Филиал ДК г. Щербинка
Хорошевский район УИК №472 2378 0.0126 0.0698 0.1985 0.4386 Школа-интернат № 42, 1 этаж, холл
район Лефортово УИК №1395 1 1657 0.1044 0.2058 0.383 0.4333 ГОУ СОШ №632
Троицкий административный округ УИК №3390 2066 0.0982 0.2224 0.369 0.4251 ДК "Юбилейный", 2-й этаж
район Северный УИК №802 2123 0.0636 0.1507 0.3111 0.4007 ДК "Северный"
Новомосковский административный округ УИК №3299 1041 0.0519 0.17 0.2373 0.3996 Здание администрации
район Хамовники УИК №160 1 1821 0.0581 0.1709 0.3502 0.398 помещение ФОК стадиона "Буревестник" Первого МГМУ им. И.М. Сеченова
район Восточный УИК №943 1021 0.0686 0.1773 0.3213 0.3976 ГУК "Клуб "Акулово"
Гагаринский район УИК №2152 2190 0.0283 0.0976 0.2452 0.3959 УД ФНПРОСП
Новомосковский административный округ УИК №3308 2359 0.0674 0.1717 0.3073 0.3904 МБУ "Центр культуры и спорта"Ватутинки"
район Восточный УИК №941 1712 0.0268 0.1214 0.2855 0.3869 ГБОУ СОШ №1021
Троицкий административный округ УИК №3378 1380 0.0522 0.1665 0.296 0.3859 ДК "Звездный", фойе 1-го этажа
район Лефортово УИК №1396 1 2679 0.062 0.1219 0.273 0.3833 Центр развития творчества детей и юношества
podmoskovnik: (mill)
Гистограммы распределения участков (взвешенные по числу зарегистрированных избирателей) по явке на 12, 15 и 18 часов. До 15 все симметрично, к 18 часам, кажется, отрос небольшой хвостик справа. Ждем итоговых данных.
hist_1800
podmoskovnik: (mill)

Явка на 10 утра в 2013 году в сравнении с явкой на 10 утра в 2012 г. по территориальным избирательным комиссиям (районам Москвы).
В сводке на 10 утра отсутствуют данные по району Люблино, Гагаринскому р-ну, Зюзино, Южному Бутово и ТИК новой Москвы.
Пока явка на уровне половины 2012 года, корреляция с 2012 слабая.

Самая высокая явка в 2012 и 2013 году (верхняя правая точка) - поселок Восточный.
Самая низкая в 2013 - Нагатинский затон.

1000

UPD Явка на 12:00. Больше 10% в Беговом, Донском, Ст. Крюково, Силино, Молжаниновке, Восточном.
Меньше 5% в Нагатинском затоне, Текстильщиках, Солнцево, Выхино-Жулебино.


1200
UPD2: на 18:00

Явка свыше 30%: Восточный, Савелки, Гагаринский, Сокольники, Силино, Арбат,
Новомосковский округ, Хорошевский, Алексеевский, Мещанский, район Хамовники
Явка ниже 24%: Можайский, Братеево, Бескудниковский, Южное Бутово, Нижегородский, Солнцево, Бирюлево Западное, Внуково

1800
podmoskovnik: (mill)

(это смутные размышления над грубо прикинутыми цифрами. Все главное сказано в заголовке поста)

Накануне завтрашнего голосования выборов полезно посмотреть на то, как проходили в Москве прошлые выборы. Поскольку нам как бы обещан честный подсчет, особенно интересно, как выглядели бы результаты этих прошлых выборов, очищенные от манипуляций при подсчете там, где они были.

Для начала еще раз настоятельно рекомендую всем прочесть чрезвычайно содержательное историческое исследование [livejournal.com profile] nonenoun:

Часть 1: http://nonenoun.livejournal.com/3772.html
Часть 2: http://nonenoun.livejournal.com/3863.html
Часть 3: http://nonenoun.livejournal.com/4106.html
Часть 4: http://nonenoun.livejournal.com/4511.html
Часть 5: http://nonenoun.livejournal.com/4795.html

Из него я позаимствую одну картинку из четвертой части (слегка модифицированную). На диаграммах в правой колонке показано, как группируются результаты голосования в координатах явка - результат кандидата власти на десяти выборах в Москве в 1999 - 2012 году (здесь нет мэрских выборов 2003 года, на которых триумфально победил Лужков, но Лужкоа - это особая история):

57025_original[1]

Помимо того, что эти диаграммы позволяют легко отличить случаи честного подсчета голосов (1999, 2000, 2003, 2012) от нечестного (2004, 2005, 2007, 2008, 2009, 2011), по ним еще можно прикинуть реальную явку и реальный результат кандидатов от власти (какими они был бы без вбросов и перекидывания голосов от одного кандидата к другому).

А именно, реальному результату соответствует центр нижнего левого кластера точек (почему это так - см. в четвертой части обзора nonenoun). Я обвел эти кластеры красными кружками. В 2005-м и 2009-м годах результаты голосования были настолько искажены манипуляциями при подсчете, что выделить четкий кластер слева внизу не удается, я взял результат партии власти, возможно, с некоторым завышением. Результат кандидата власти в 2004-м году тоже, возможно, был завышен при подсчете (см. зеленый кластер под кружком), но я оставлю это без внимания.

Принимая численность избирателей в Москве за 7 млн и не претендуя на особую точность, можно выписать такие результаты голосования, очищенные от фальсификаций:

Год Явка Результат
кандидата
власти
Кол-во голосов
за кандидата
власти, млн
1999 63% 48% 2.1
2000 65% 48% 2.2
2003 58% 38% 1.5
2004 52% 68% 2.5
2005 33% 40% 0.9
2007 52% 52% 1.9
2008 52% 63% 2.3
2009 23% 45% 0.7
2011 50% 23% 0.8
2012 58% 47% 1.9

В виде диаграммы, отсортированной по результату кандидата власти, это выглядит так:

historic
Что можно сказать.

1. Из десяти рассмотренных выборов результат кандидата власти (КВ) превысил 50% на трех выборах - в 2004 (Путин), 2008 (Медведев) и 2007 (ЕР) годах. Еще на трех выборах результат КВ немного (но явственно) не дотянул до 50% - в 1999, 2000 и 2012-м. В 2009, 2005, 2003 и 2011-м годах результат КВ заметно не дотягивал до 50%.
2. Максимальное количество голосов, поданных за кандидата власти в Москве, составляет 2,5 млн в 2004 г. и 2,3 млн в 2008. Принимая во внимание не учтенное здесь возможное завышение числа голосов в 2004 году, не исключено, что максимум был в 2008 году у Медведева (если не считать 3 млн голосов за Лужкова в 2003 году).
3. Высокая активность избирателей КВ (свыше 1,5 млн поданных голосов) наблюдалась на выборах федерального уровня. На местных выборах (2009 и 2005 годы) количество голосов за КВ не доходило до миллиона. Учитывая первоначально вялую избирательную кампанию, количество голосов за вриомэра я бы оценил сверху числом в 1,2 млн (среднее между результатами 2003 и 2005 года).
4. Численность голосующих "демократических" избирателей в Москве можно оценить в 900 тыс. человек (на президентских выборах 2012 года за Прохорова проголосовало 870 тыс. человек, на выборах 2000 г. за Явлинского и Памфилову - 950 тыс.).
5. Численность голосующих "коммунистических" избирателей в Москве - около 850 тыс. человек (Зюганов-2000 890 тыс., Зюганов-2012 814 тыс.).

Дальше спекуляции и прикидки.

Собянин   1,2 млн
Мельников  420 тыс (50% коммунистических избирателей)
Митрохин   200 тыс. (кто-то же голосовал в 2012-м году за Миронова? Наверное, это твердые яблочники, которые не хотели голосовать за Прохорова. Вот это они и есть)
Дегтярев  130 тыс. (половина результата Жириновского в 2012 г.)
Левичев  50 тыс. (на уровне ошибки)

Итого до второго тура сторонникам Навального остается набрать 400 тыс. голосов.

Короче, все на выборы.

podmoskovnik: (mill)
Великолепная история на Ленте.ру:

В Зеленоградском (5 районов) и Южном (16 районов) административных округа количество избирателей снизилось в каждом из районов ровно на 2,00 процента. То есть в 21 районе изменения в количестве зарегистрированных избирателей оказались одинаковы вплоть до сотых долей процента (численность населения московских районов, в которых проживают более 10 тысяч избирателей, мы округляли до сотых, остальные — до десятых процента; при таком пределе округления значения вычисляются с точностью до нескольких человек — прим. редакции). Далее, в большинстве районов Восточного (16) и Северного (16) административных округов количество избирателей также снизилось ровно на 2,00 и 1,80 процента соответственно. Подобные изменения возможны в том и лишь исключительно в том случае, если списки избирателей корректировались вручную.
podmoskovnik: (mill)
Update: уже бывший, оказывается. Спасибо [livejournal.com profile] sciencewriter за указание. Аккуратнее надо быть. Но все равно интересно.

К предыдущему.

А знаете ли вы, кто у нас руководитель Муниципального образования «Гагаринское»?
А вот кто. )

См, например, http://prahvessor.livejournal.com/332934.html

Profile

podmoskovnik: (Default)
podmoskovnik

November 2016

S M T W T F S
  12345
6789101112
13141516171819
2021 2223242526
27282930   

Syndicate

RSS Atom

Style Credit

Expand Cut Tags

No cut tags
Page generated Sep. 23rd, 2017 07:59 pm
Powered by Dreamwidth Studios