podmoskovnik: (Default)
в пандан к предпредыдущему посту



Интервал суммирования 1%.
Все как обычно. Просматриваются пики на 70%, 75%, 80%, 85%, 90%, 99%. Скучно жить на свете, господа!
Таблица:
% голосов за ЕР Число УИК
0% 74
1% 0
2% 2
3% 0
4% 2
5% 3
6% 0
7% 3
8% 1
9% 10
10% 2
11% 5
12% 3
13% 3
14% 6
15% 5
16% 6
17% 5
18% 12
19% 7
20% 11
21% 5
22% 8
23% 6
24% 4
25% 25
26% 15
27% 24
28% 17
29% 28
30% 32
31% 32
32% 34
33% 45
34% 38
35% 53
36% 70
37% 108
38% 130
39% 152
40% 265
41% 267
42% 406
43% 514
44% 642
45% 769
46% 968
47% 1105
48% 1364
49% 1507
50% 1860
51% 2088
52% 2303
53% 2330
54% 2483
55% 2649
56% 2679
57% 2775
58% 2706
59% 2742
60% 2825
61% 2845
62% 2743
63% 2704
64% 2724
65% 2652
66% 2610
67% 2530
68% 2404
69% 2381
70% 2382
71% 2266
72% 2160
73% 1983
74% 1909
75% 1983
76% 1663
77% 1553
78% 1414
79% 1302
80% 1460
81% 1221
82% 1020
83% 959
84% 868
85% 896
86% 749
87% 650
88% 567
89% 633
90% 927
91% 770
92% 645
93% 539
94% 608
95% 750
96% 775
97% 802
98% 1163
99% 1235
100% 552
podmoskovnik: (Default)
в пандан к предпредыдущему посту



Интервал суммирования 1%.
Все как обычно. Просматриваются пики на 70%, 75%, 80%, 85%, 90%, 99%. Скучно жить на свете, господа!
Таблица:
% голосов за ЕР Число УИК
0% 74
1% 0
2% 2
3% 0
4% 2
5% 3
6% 0
7% 3
8% 1
9% 10
10% 2
11% 5
12% 3
13% 3
14% 6
15% 5
16% 6
17% 5
18% 12
19% 7
20% 11
21% 5
22% 8
23% 6
24% 4
25% 25
26% 15
27% 24
28% 17
29% 28
30% 32
31% 32
32% 34
33% 45
34% 38
35% 53
36% 70
37% 108
38% 130
39% 152
40% 265
41% 267
42% 406
43% 514
44% 642
45% 769
46% 968
47% 1105
48% 1364
49% 1507
50% 1860
51% 2088
52% 2303
53% 2330
54% 2483
55% 2649
56% 2679
57% 2775
58% 2706
59% 2742
60% 2825
61% 2845
62% 2743
63% 2704
64% 2724
65% 2652
66% 2610
67% 2530
68% 2404
69% 2381
70% 2382
71% 2266
72% 2160
73% 1983
74% 1909
75% 1983
76% 1663
77% 1553
78% 1414
79% 1302
80% 1460
81% 1221
82% 1020
83% 959
84% 868
85% 896
86% 749
87% 650
88% 567
89% 633
90% 927
91% 770
92% 645
93% 539
94% 608
95% 750
96% 775
97% 802
98% 1163
99% 1235
100% 552
podmoskovnik: (Default)
Раз уж зашла речь о размерах участков, интересно, как будет выглядеть распределение голосов по размерам участков, на которых голосовали люди. Понятно, что размер участка - менее релевантная мера админресурса, чем явка, хотя определенная корреляция должна быть. На маленьких участках и возможности для манипуляций, и административный ресурс вроде бы больше. А что на самом деле?

Распределение голосов за партии:


ЕР опять выделяется: на малых участках ее преимущество над всеми остальными партиями значительно возрастает. Попробуем выделить аномальную часть, как раньше:



Довольно наглядно. Количество "аномальных" голосов ЕР получается примерно 9.3 млн из 44.7, или 8.6% от списочного состава из 41%. Меньше, чем при анализе по явке, что понятно, т.к. размер участка менее связан с административным ресурсом, чем явка.

И для контроля попробуем выделить аномальную часть из голосов за КПРФ:


Ничего.
podmoskovnik: (Default)
Раз уж зашла речь о размерах участков, интересно, как будет выглядеть распределение голосов по размерам участков, на которых голосовали люди. Понятно, что размер участка - менее релевантная мера админресурса, чем явка, хотя определенная корреляция должна быть. На маленьких участках и возможности для манипуляций, и административный ресурс вроде бы больше. А что на самом деле?

Распределение голосов за партии:


ЕР опять выделяется: на малых участках ее преимущество над всеми остальными партиями значительно возрастает. Попробуем выделить аномальную часть, как раньше:



Довольно наглядно. Количество "аномальных" голосов ЕР получается примерно 9.3 млн из 44.7, или 8.6% от списочного состава из 41%. Меньше, чем при анализе по явке, что понятно, т.к. размер участка менее связан с административным ресурсом, чем явка.

И для контроля попробуем выделить аномальную часть из голосов за КПРФ:


Ничего.
podmoskovnik: (Default)
что станет с предыдущим графиком, если учитывать не число комиссий, а количество зарегистрированных на них избирателей. Как справедливо заметил уважаемый [personal profile] oude_rus, имеется очень много мелких избирательных комиссий, которые могут влиять на это распределение, не влияя существенно на итоги выборов.
А будет вот что:


В области основного пика нумерологические художества смягчаются, но начиная с 70% вполне процветают.
55%: плато на пике
60%: локальный максимум
65%: гладко
70%, 75%, 80%, 85%, 90%, 95%, 100%  - локальные максимумы
Все локальные максимумы после основного пика по-прежнему находятся в точках, кратных 5.
podmoskovnik: (Default)
что станет с предыдущим графиком, если учитывать не число комиссий, а количество зарегистрированных на них избирателей. Как справедливо заметил уважаемый [personal profile] oude_rus, имеется очень много мелких избирательных комиссий, которые могут влиять на это распределение, не влияя существенно на итоги выборов.
А будет вот что:


В области основного пика нумерологические художества смягчаются, но начиная с 70% вполне процветают.
55%: плато на пике
60%: локальный максимум
65%: гладко
70%, 75%, 80%, 85%, 90%, 95%, 100%  - локальные максимумы
Все локальные максимумы после основного пика по-прежнему находятся в точках, кратных 5.
podmoskovnik: (Default)
Помните, на графике для Татарстана наблюдался сильный шум? Так вот, этот шум был неспроста. Вот еще один график, я бы даже сказал, графЕГ.



Распределение по всей РФ.
Локальные максимумы распределения располагаются в точках 55%, 60%, 70%, 75%, 80%, 85%, 95%, 100%. Точке 65% не повезло - попала на склон, и в ней только излом.
Все-таки привычка красить траву нас однажды погубит.
podmoskovnik: (Default)
Помните, на графике для Татарстана наблюдался сильный шум? Так вот, этот шум был неспроста. Вот еще один график, я бы даже сказал, графЕГ.



Распределение по всей РФ.
Локальные максимумы распределения располагаются в точках 55%, 60%, 70%, 75%, 80%, 85%, 95%, 100%. Точке 65% не повезло - попала на склон, и в ней только излом.
Все-таки привычка красить траву нас однажды погубит.
podmoskovnik: (Default)
ЕР: "аномальных" голосов 5.3% из 37.1% от списочного состава


КПРФ: аномалия на уровне шума
podmoskovnik: (Default)
ЕР: "аномальных" голосов 5.3% из 37.1% от списочного состава


КПРФ: аномалия на уровне шума
podmoskovnik: (Default)
ЕР:

Выделение аномальной части по самому либеральному (по отношению к ЕР) варианту. Получается, что аномалия дает где-то 3.4% из полученных ими 29.8% от спиcочного состава по Москве.

Для сравнения - КПРФ:

Аномалия практически отсутствует.
podmoskovnik: (Default)
ЕР:

Выделение аномальной части по самому либеральному (по отношению к ЕР) варианту. Получается, что аномалия дает где-то 3.4% из полученных ими 29.8% от спиcочного состава по Москве.

Для сравнения - КПРФ:

Аномалия практически отсутствует.
podmoskovnik: (Default)
Итак, у нас есть полные данные выборов с детализацией до участковых комиссий. Объем данных колоссальный. Попробуем извлечь из них что-либо новое.

Первое. Из предыдущего анализа видно, что есть четкая корреляция, практически линейная зависимость, между явкой и голосами, отданными за Единую Россию. Для других партий такой корреляции нет. Это наводит на мысль, что есть некий скрытый фактор, который действует в пользу ЕР, но не других партий, и хорошим измерителем этого фактора является явка избирателей.

Попробуем изучить влияние нашего фактора подробнее. Поскольку самого фактора в нашем распоряжении нет, его представителем будет выступать явка избирателей. Так как главным результатом выборов являются голоса, поданные за партии, попробуем посчитать, как распределяется количество голосов за разные партии в зависимости от явки на избирательные участки. Итак, график 1:



Все участковые избирательные комиссии России были разбиты на группы по явке по интервалам длиной 1% (от 40% до 41%, от 41% до 42% и т.п.), после чего поданные за партии голоса были просуммированы по всем таким группам. Помимо отдельных партий, приведен график для суммарных результатов всех партий за исключением ЕР.

Первое, что бросается в глаза - график для ЕР разительно отличается от графиков других партий. Графики всех остальных партий фактически подобны - представляют собой одну и ту же зависимость с разными множителями. Это означает, что распределение поданных голосов по партиям (кроме ЕР) фактически не зависит от явки избирателей. Утверждение достаточно сильное, но графики его подтверждают вполне наглядно. Чтобы еще раз в этом убедиться, привожу график 2:



На графике показаны  результаты основных партий, нормированные на суммарный результат всех партий без ЕР (желтая кривая графика 1). В области левее 33% голосов очень мало, и сильные колебания графиков обусловлены просто статистическим шумом. Зато дальше кривые всех партий идут практически горизонтально - кроме ЕР, которая после небольшого плато начинает расти и к концу диапазона зашкаливает за 20. Итак, мы еще раз видим, что голосование за "нормальные" партии практически не зависит от явки, и только ЕР проявляет аномальное поведение.

Предположив, что это аномальное поведение обусловлено влиянием того самого скрытого фактора, попробуем выделить это влияние в чистом виде. Представим себе, что голоса, поданные за ЕР, состоят из двух составляющих - "нормальной" и "аномальной". При этом "нормальная" часть должна представлять собой кривую, подобную кривым голосования за все остальные партии, а "аномальная" - остаток, не описываемый такой кривой. Таким образом, формула должна выглядеть так:

                    (голоса за ЕР) = (подгоночный коэффициент) * (голоса за все партии без ЕР) + (аномальная часть)

Естественно, разбиение на компоненты зависит от величины подгоночного коэффициента. Самое очевидное решение - подобрать его так, чтобы обе составляющие (и нормальная, и аномальная) были положительны и при этом "нормальная" часть была как можно больше. Этому критерию удовлетворяет величина 1.2776 - значение кривой ЕР на графике 2 в точке минимума (при 49%). В результате получаем такое разбиение:



Полученный результат в определенной степени подтверждает наше предположение. "Аномальная" часть четко выделяется из общего результата голосования за ЕР; она практически отсутствует при явке ниже ~52% и резко появляется и устойчиво растет выше этого порога. Она имеет мало общего по форме с "нормальной" кривой голосования за все остальные партии.
(Замечу в скобках, что попытка для контроля выделить подобную "аномальную" часть в результатах КПРФ не дает значимого результата: "аномалия" находится на уровне менее 5% процентов от числа проголосовавших за эту партию).

Понимая всю спорность этого тезиса, можно взять на себя смелость приписать эту "аномальную" часть голосов нашему скрытому фактору, играющему за ЕР. Тогда, учитывая все изложенное выше, появляется возможность ответить на главный вопрос: как сказался наш скрытый фактор на результатах выборов? Суммируя отдельно "нормальную" и "аномальную" части голосов за ЕР, получаем следующие цифры проголосовавших за эту партию:

"Нормальная" часть:    30.7 млн голосов
"Аномальная" часть:     14 млн голосов
Всего:     44.7 млн голосов

Если в качестве гипотезы исключить "аномальные" голоса за ЕР из результатов выборов, получим следующее распределение голосов за ведущие партии:

КПРФ:   14.68%
ЛДПР:   10.33%
СПРос:   9.82%
ЕР:   56.09%
Явка на выборы составила бы 50.2%.

Соответственно распределение мандатов в Думе было бы таким:

КПРФ:   73
ЛДПР:   51
СПРос:   49
ЕР:   277
Сейчас эти партии имеют 57, 40, 38 и 315 мандатов соответственно - отличие не радикальное, но существенное.

Насколько обоснованны эти выводы?  Строго говоря, нинасколько. Вполне можно предположить, что избиратели ЕР принципиально отличаются по социальному поведению от избирателей других партий и обладают выраженной склонностью к коллективному голосованию за любимую партию в обстановке максимальной явки. Далее, наш подход не дает никакой возможности исключить манипуляции в любую сторону "в пределах мейнстрима" - т.е. таких, которые не меняют формы кривой голосования в зависимости от явки. Например, если бы участковые избирательные комиссии по всей стране дружно сговорились завышать на 10% число голосов за КПРФ, отнимая их у Единой России, наш подход был бы бессилен выявить это.
Кроме того, остается вопрос выбора коэффициента для "нормальной" части. Здесь, правда, ситуация проще. Изменение подгоночного коэффициента на 0.01 меняет итоговое число мандатов ЕР в Думе примерно на 1. При этом эксперимент показывает, что оптимальное значение находится где-то в пределах от 1.25 до 1.31, так что итоговые результаты существенно отличаться от приведенных не будут.
podmoskovnik: (Default)
Итак, у нас есть полные данные выборов с детализацией до участковых комиссий. Объем данных колоссальный. Попробуем извлечь из них что-либо новое.

Первое. Из предыдущего анализа видно, что есть четкая корреляция, практически линейная зависимость, между явкой и голосами, отданными за Единую Россию. Для других партий такой корреляции нет. Это наводит на мысль, что есть некий скрытый фактор, который действует в пользу ЕР, но не других партий, и хорошим измерителем этого фактора является явка избирателей.

Попробуем изучить влияние нашего фактора подробнее. Поскольку самого фактора в нашем распоряжении нет, его представителем будет выступать явка избирателей. Так как главным результатом выборов являются голоса, поданные за партии, попробуем посчитать, как распределяется количество голосов за разные партии в зависимости от явки на избирательные участки. Итак, график 1:



Все участковые избирательные комиссии России были разбиты на группы по явке по интервалам длиной 1% (от 40% до 41%, от 41% до 42% и т.п.), после чего поданные за партии голоса были просуммированы по всем таким группам. Помимо отдельных партий, приведен график для суммарных результатов всех партий за исключением ЕР.

Первое, что бросается в глаза - график для ЕР разительно отличается от графиков других партий. Графики всех остальных партий фактически подобны - представляют собой одну и ту же зависимость с разными множителями. Это означает, что распределение поданных голосов по партиям (кроме ЕР) фактически не зависит от явки избирателей. Утверждение достаточно сильное, но графики его подтверждают вполне наглядно. Чтобы еще раз в этом убедиться, привожу график 2:



На графике показаны  результаты основных партий, нормированные на суммарный результат всех партий без ЕР (желтая кривая графика 1). В области левее 33% голосов очень мало, и сильные колебания графиков обусловлены просто статистическим шумом. Зато дальше кривые всех партий идут практически горизонтально - кроме ЕР, которая после небольшого плато начинает расти и к концу диапазона зашкаливает за 20. Итак, мы еще раз видим, что голосование за "нормальные" партии практически не зависит от явки, и только ЕР проявляет аномальное поведение.

Предположив, что это аномальное поведение обусловлено влиянием того самого скрытого фактора, попробуем выделить это влияние в чистом виде. Представим себе, что голоса, поданные за ЕР, состоят из двух составляющих - "нормальной" и "аномальной". При этом "нормальная" часть должна представлять собой кривую, подобную кривым голосования за все остальные партии, а "аномальная" - остаток, не описываемый такой кривой. Таким образом, формула должна выглядеть так:

                    (голоса за ЕР) = (подгоночный коэффициент) * (голоса за все партии без ЕР) + (аномальная часть)

Естественно, разбиение на компоненты зависит от величины подгоночного коэффициента. Самое очевидное решение - подобрать его так, чтобы обе составляющие (и нормальная, и аномальная) были положительны и при этом "нормальная" часть была как можно больше. Этому критерию удовлетворяет величина 1.2776 - значение кривой ЕР на графике 2 в точке минимума (при 49%). В результате получаем такое разбиение:



Полученный результат в определенной степени подтверждает наше предположение. "Аномальная" часть четко выделяется из общего результата голосования за ЕР; она практически отсутствует при явке ниже ~52% и резко появляется и устойчиво растет выше этого порога. Она имеет мало общего по форме с "нормальной" кривой голосования за все остальные партии.
(Замечу в скобках, что попытка для контроля выделить подобную "аномальную" часть в результатах КПРФ не дает значимого результата: "аномалия" находится на уровне менее 5% процентов от числа проголосовавших за эту партию).

Понимая всю спорность этого тезиса, можно взять на себя смелость приписать эту "аномальную" часть голосов нашему скрытому фактору, играющему за ЕР. Тогда, учитывая все изложенное выше, появляется возможность ответить на главный вопрос: как сказался наш скрытый фактор на результатах выборов? Суммируя отдельно "нормальную" и "аномальную" части голосов за ЕР, получаем следующие цифры проголосовавших за эту партию:

"Нормальная" часть:    30.7 млн голосов
"Аномальная" часть:     14 млн голосов
Всего:     44.7 млн голосов

Если в качестве гипотезы исключить "аномальные" голоса за ЕР из результатов выборов, получим следующее распределение голосов за ведущие партии:

КПРФ:   14.68%
ЛДПР:   10.33%
СПРос:   9.82%
ЕР:   56.09%
Явка на выборы составила бы 50.2%.

Соответственно распределение мандатов в Думе было бы таким:

КПРФ:   73
ЛДПР:   51
СПРос:   49
ЕР:   277
Сейчас эти партии имеют 57, 40, 38 и 315 мандатов соответственно - отличие не радикальное, но существенное.

Насколько обоснованны эти выводы?  Строго говоря, нинасколько. Вполне можно предположить, что избиратели ЕР принципиально отличаются по социальному поведению от избирателей других партий и обладают выраженной склонностью к коллективному голосованию за любимую партию в обстановке максимальной явки. Далее, наш подход не дает никакой возможности исключить манипуляции в любую сторону "в пределах мейнстрима" - т.е. таких, которые не меняют формы кривой голосования в зависимости от явки. Например, если бы участковые избирательные комиссии по всей стране дружно сговорились завышать на 10% число голосов за КПРФ, отнимая их у Единой России, наш подход был бы бессилен выявить это.
Кроме того, остается вопрос выбора коэффициента для "нормальной" части. Здесь, правда, ситуация проще. Изменение подгоночного коэффициента на 0.01 меняет итоговое число мандатов ЕР в Думе примерно на 1. При этом эксперимент показывает, что оптимальное значение находится где-то в пределах от 1.25 до 1.31, так что итоговые результаты существенно отличаться от приведенных не будут.
podmoskovnik: (Default)
Update от 11.10.08: обнаружил в tabdelimited и Excel-файлах сбой форматирования в связи с тем, что не во всех регионах в отчетах учитывались утраченные и недействительные открепительные удостоверения. В результате результаты партий для этих регионов попадали не в свои колонки.
Исправил, выложил новые файлы, поправил ссылки.

Исправил ошибки. Брянская область восстановлена в правах, Магадан возвращен из Липецкой области в Магаданскую.
Сверил контрольные суммы по субъектам с итоговыми данными ЦИК. Все сошлось с учетом наличия двух исходно некорректных отчетов ТИК. Подробности в архивах.

Выкладываю файлы:

Полный архив отчетов ТИК в формате csv: Elections_2007_csv.zip (8345 кбайт)  http://rapidshare.de/files/38261222/Elections_2007_csv.zip.html

Сводные данные одним файлом в tab-delimited формате:
Elections_2007_tabdelimited.zip (5414 кбайт)
http://rapidshare.de/files/38271045/Elections_2007_tabdelimited.zip.html

Сводные данные одним файлом в формате Excel (2 листа!): Elections_2007_xls.zip (13372 кбайт)
http://rapidshare.de/files/38271060/Elections_2007_xls.zip.html

Успехов.
podmoskovnik: (Default)
Update от 11.10.08: обнаружил в tabdelimited и Excel-файлах сбой форматирования в связи с тем, что не во всех регионах в отчетах учитывались утраченные и недействительные открепительные удостоверения. В результате результаты партий для этих регионов попадали не в свои колонки.
Исправил, выложил новые файлы, поправил ссылки.

Исправил ошибки. Брянская область восстановлена в правах, Магадан возвращен из Липецкой области в Магаданскую.
Сверил контрольные суммы по субъектам с итоговыми данными ЦИК. Все сошлось с учетом наличия двух исходно некорректных отчетов ТИК. Подробности в архивах.

Выкладываю файлы:

Полный архив отчетов ТИК в формате csv: Elections_2007_csv.zip (8345 кбайт)  http://rapidshare.de/files/38261222/Elections_2007_csv.zip.html

Сводные данные одним файлом в tab-delimited формате:
Elections_2007_tabdelimited.zip (5414 кбайт)
http://rapidshare.de/files/38271045/Elections_2007_tabdelimited.zip.html

Сводные данные одним файлом в формате Excel (2 листа!): Elections_2007_xls.zip (13372 кбайт)
http://rapidshare.de/files/38271060/Elections_2007_xls.zip.html

Успехов.
podmoskovnik: (Default)
UPD: Пользователь[info]liberalparty_ru обнаружил в данных пропуски, за что ему большое спасибо. Архив удаляю, исправлю ошибки - выложу снова.

Если это кому-то еще интересно - собрал полные результаты выборов в Госдуму с детализацией до участковых избирательных комиссий. Архив отчетов в формате CSV (8.3 Мбайт) лежит на http://rapidshare.de/files/38149159/Elections_2007.zip.html. Подробности в архиве.

Как дойдут руки, сделаю то же самое одним файлом.
Инджой. С наступающим.
podmoskovnik: (Default)
UPD: Пользователь[info]liberalparty_ru обнаружил в данных пропуски, за что ему большое спасибо. Архив удаляю, исправлю ошибки - выложу снова.

Если это кому-то еще интересно - собрал полные результаты выборов в Госдуму с детализацией до участковых избирательных комиссий. Архив отчетов в формате CSV (8.3 Мбайт) лежит на http://rapidshare.de/files/38149159/Elections_2007.zip.html. Подробности в архиве.

Как дойдут руки, сделаю то же самое одним файлом.
Инджой. С наступающим.

Profile

podmoskovnik: (Default)
podmoskovnik

November 2016

S M T W T F S
  12345
6789101112
13141516171819
2021 2223242526
27282930   

Syndicate

RSS Atom

Style Credit

Expand Cut Tags

No cut tags
Page generated Jul. 23rd, 2017 06:46 pm
Powered by Dreamwidth Studios