Итак, у нас есть полные данные выборов с детализацией до участковых комиссий. Объем данных колоссальный. Попробуем извлечь из них что-либо новое.
Первое. Из предыдущего анализа видно, что есть четкая корреляция, практически линейная зависимость, между явкой и голосами, отданными за Единую Россию. Для других партий такой корреляции нет. Это наводит на мысль, что есть некий скрытый фактор, который действует в пользу ЕР, но не других партий, и хорошим измерителем этого фактора является явка избирателей.
Попробуем изучить влияние нашего фактора подробнее. Поскольку самого фактора в нашем распоряжении нет, его представителем будет выступать явка избирателей. Так как главным результатом выборов являются голоса, поданные за партии, попробуем посчитать, как распределяется количество голосов за разные партии в зависимости от явки на избирательные участки. Итак, график 1:

Все участковые избирательные комиссии России были разбиты на группы по явке по интервалам длиной 1% (от 40% до 41%, от 41% до 42% и т.п.), после чего поданные за партии голоса были просуммированы по всем таким группам. Помимо отдельных партий, приведен график для суммарных результатов всех партий за исключением ЕР.
Первое, что бросается в глаза - график для ЕР разительно отличается от графиков других партий. Графики всех остальных партий фактически подобны - представляют собой одну и ту же зависимость с разными множителями. Это означает, что распределение поданных голосов по партиям (кроме ЕР) фактически не зависит от явки избирателей. Утверждение достаточно сильное, но графики его подтверждают вполне наглядно. Чтобы еще раз в этом убедиться, привожу график 2:

На графике показаны результаты основных партий, нормированные на суммарный результат всех партий без ЕР (желтая кривая графика 1). В области левее 33% голосов очень мало, и сильные колебания графиков обусловлены просто статистическим шумом. Зато дальше кривые всех партий идут практически горизонтально - кроме ЕР, которая после небольшого плато начинает расти и к концу диапазона зашкаливает за 20. Итак, мы еще раз видим, что голосование за "нормальные" партии практически не зависит от явки, и только ЕР проявляет аномальное поведение.
Предположив, что это аномальное поведение обусловлено влиянием того самого скрытого фактора, попробуем выделить это влияние в чистом виде. Представим себе, что голоса, поданные за ЕР, состоят из двух составляющих - "нормальной" и "аномальной". При этом "нормальная" часть должна представлять собой кривую, подобную кривым голосования за все остальные партии, а "аномальная" - остаток, не описываемый такой кривой. Таким образом, формула должна выглядеть так:
(голоса за ЕР) = (подгоночный коэффициент) * (голоса за все партии без ЕР) + (аномальная часть)
Естественно, разбиение на компоненты зависит от величины подгоночного коэффициента. Самое очевидное решение - подобрать его так, чтобы обе составляющие (и нормальная, и аномальная) были положительны и при этом "нормальная" часть была как можно больше. Этому критерию удовлетворяет величина 1.2776 - значение кривой ЕР на графике 2 в точке минимума (при 49%). В результате получаем такое разбиение:

Полученный результат в определенной степени подтверждает наше предположение. "Аномальная" часть четко выделяется из общего результата голосования за ЕР; она практически отсутствует при явке ниже ~52% и резко появляется и устойчиво растет выше этого порога. Она имеет мало общего по форме с "нормальной" кривой голосования за все остальные партии.
(Замечу в скобках, что попытка для контроля выделить подобную "аномальную" часть в результатах КПРФ не дает значимого результата: "аномалия" находится на уровне менее 5% процентов от числа проголосовавших за эту партию).
Понимая всю спорность этого тезиса, можно взять на себя смелость приписать эту "аномальную" часть голосов нашему скрытому фактору, играющему за ЕР. Тогда, учитывая все изложенное выше, появляется возможность ответить на главный вопрос: как сказался наш скрытый фактор на результатах выборов? Суммируя отдельно "нормальную" и "аномальную" части голосов за ЕР, получаем следующие цифры проголосовавших за эту партию:
"Нормальная" часть: 30.7 млн голосов
"Аномальная" часть: 14 млн голосов
Всего: 44.7 млн голосов
Если в качестве гипотезы исключить "аномальные" голоса за ЕР из результатов выборов, получим следующее распределение голосов за ведущие партии:
КПРФ: 14.68%
ЛДПР: 10.33%
СПРос: 9.82%
ЕР: 56.09%
Явка на выборы составила бы 50.2%.
Соответственно распределение мандатов в Думе было бы таким:
КПРФ: 73
ЛДПР: 51
СПРос: 49
ЕР: 277
Сейчас эти партии имеют 57, 40, 38 и 315 мандатов соответственно - отличие не радикальное, но существенное.
Насколько обоснованны эти выводы? Строго говоря, нинасколько. Вполне можно предположить, что избиратели ЕР принципиально отличаются по социальному поведению от избирателей других партий и обладают выраженной склонностью к коллективному голосованию за любимую партию в обстановке максимальной явки. Далее, наш подход не дает никакой возможности исключить манипуляции в любую сторону "в пределах мейнстрима" - т.е. таких, которые не меняют формы кривой голосования в зависимости от явки. Например, если бы участковые избирательные комиссии по всей стране дружно сговорились завышать на 10% число голосов за КПРФ, отнимая их у Единой России, наш подход был бы бессилен выявить это.
Кроме того, остается вопрос выбора коэффициента для "нормальной" части. Здесь, правда, ситуация проще. Изменение подгоночного коэффициента на 0.01 меняет итоговое число мандатов ЕР в Думе примерно на 1. При этом эксперимент показывает, что оптимальное значение находится где-то в пределах от 1.25 до 1.31, так что итоговые результаты существенно отличаться от приведенных не будут.
Первое. Из предыдущего анализа видно, что есть четкая корреляция, практически линейная зависимость, между явкой и голосами, отданными за Единую Россию. Для других партий такой корреляции нет. Это наводит на мысль, что есть некий скрытый фактор, который действует в пользу ЕР, но не других партий, и хорошим измерителем этого фактора является явка избирателей.
Попробуем изучить влияние нашего фактора подробнее. Поскольку самого фактора в нашем распоряжении нет, его представителем будет выступать явка избирателей. Так как главным результатом выборов являются голоса, поданные за партии, попробуем посчитать, как распределяется количество голосов за разные партии в зависимости от явки на избирательные участки. Итак, график 1:
Все участковые избирательные комиссии России были разбиты на группы по явке по интервалам длиной 1% (от 40% до 41%, от 41% до 42% и т.п.), после чего поданные за партии голоса были просуммированы по всем таким группам. Помимо отдельных партий, приведен график для суммарных результатов всех партий за исключением ЕР.
Первое, что бросается в глаза - график для ЕР разительно отличается от графиков других партий. Графики всех остальных партий фактически подобны - представляют собой одну и ту же зависимость с разными множителями. Это означает, что распределение поданных голосов по партиям (кроме ЕР) фактически не зависит от явки избирателей. Утверждение достаточно сильное, но графики его подтверждают вполне наглядно. Чтобы еще раз в этом убедиться, привожу график 2:
На графике показаны результаты основных партий, нормированные на суммарный результат всех партий без ЕР (желтая кривая графика 1). В области левее 33% голосов очень мало, и сильные колебания графиков обусловлены просто статистическим шумом. Зато дальше кривые всех партий идут практически горизонтально - кроме ЕР, которая после небольшого плато начинает расти и к концу диапазона зашкаливает за 20. Итак, мы еще раз видим, что голосование за "нормальные" партии практически не зависит от явки, и только ЕР проявляет аномальное поведение.
Предположив, что это аномальное поведение обусловлено влиянием того самого скрытого фактора, попробуем выделить это влияние в чистом виде. Представим себе, что голоса, поданные за ЕР, состоят из двух составляющих - "нормальной" и "аномальной". При этом "нормальная" часть должна представлять собой кривую, подобную кривым голосования за все остальные партии, а "аномальная" - остаток, не описываемый такой кривой. Таким образом, формула должна выглядеть так:
(голоса за ЕР) = (подгоночный коэффициент) * (голоса за все партии без ЕР) + (аномальная часть)
Естественно, разбиение на компоненты зависит от величины подгоночного коэффициента. Самое очевидное решение - подобрать его так, чтобы обе составляющие (и нормальная, и аномальная) были положительны и при этом "нормальная" часть была как можно больше. Этому критерию удовлетворяет величина 1.2776 - значение кривой ЕР на графике 2 в точке минимума (при 49%). В результате получаем такое разбиение:
Полученный результат в определенной степени подтверждает наше предположение. "Аномальная" часть четко выделяется из общего результата голосования за ЕР; она практически отсутствует при явке ниже ~52% и резко появляется и устойчиво растет выше этого порога. Она имеет мало общего по форме с "нормальной" кривой голосования за все остальные партии.
(Замечу в скобках, что попытка для контроля выделить подобную "аномальную" часть в результатах КПРФ не дает значимого результата: "аномалия" находится на уровне менее 5% процентов от числа проголосовавших за эту партию).
Понимая всю спорность этого тезиса, можно взять на себя смелость приписать эту "аномальную" часть голосов нашему скрытому фактору, играющему за ЕР. Тогда, учитывая все изложенное выше, появляется возможность ответить на главный вопрос: как сказался наш скрытый фактор на результатах выборов? Суммируя отдельно "нормальную" и "аномальную" части голосов за ЕР, получаем следующие цифры проголосовавших за эту партию:
"Нормальная" часть: 30.7 млн голосов
"Аномальная" часть: 14 млн голосов
Всего: 44.7 млн голосов
Если в качестве гипотезы исключить "аномальные" голоса за ЕР из результатов выборов, получим следующее распределение голосов за ведущие партии:
КПРФ: 14.68%
ЛДПР: 10.33%
СПРос: 9.82%
ЕР: 56.09%
Явка на выборы составила бы 50.2%.
Соответственно распределение мандатов в Думе было бы таким:
КПРФ: 73
ЛДПР: 51
СПРос: 49
ЕР: 277
Сейчас эти партии имеют 57, 40, 38 и 315 мандатов соответственно - отличие не радикальное, но существенное.
Насколько обоснованны эти выводы? Строго говоря, нинасколько. Вполне можно предположить, что избиратели ЕР принципиально отличаются по социальному поведению от избирателей других партий и обладают выраженной склонностью к коллективному голосованию за любимую партию в обстановке максимальной явки. Далее, наш подход не дает никакой возможности исключить манипуляции в любую сторону "в пределах мейнстрима" - т.е. таких, которые не меняют формы кривой голосования в зависимости от явки. Например, если бы участковые избирательные комиссии по всей стране дружно сговорились завышать на 10% число голосов за КПРФ, отнимая их у Единой России, наш подход был бы бессилен выявить это.
Кроме того, остается вопрос выбора коэффициента для "нормальной" части. Здесь, правда, ситуация проще. Изменение подгоночного коэффициента на 0.01 меняет итоговое число мандатов ЕР в Думе примерно на 1. При этом эксперимент показывает, что оптимальное значение находится где-то в пределах от 1.25 до 1.31, так что итоговые результаты существенно отличаться от приведенных не будут.