Выборы в МГД - подробные данные 2
Oct. 13th, 2009 03:44 pm![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
Вместо того чтобы проводить через точки приведенного в предыдущем посте графика регрессионные прямые (что ИМХО не есть правильно), дальнейший анализ подробных данных проведем так, как и раньше: просуммируем голоса избирателей по 1%-ным интервелам явки и посмотрим на результирующие графики. Подробно этот подход излагался в http://podmoskovnik.livejournal.com/5717.html
Итак, распределения голосов в зависимости от явки:

Как и в предыдущих анализах, видно, что голоса за все партии распределены по явкам очень похоже (ЛДПР, СпРос и Яблоко - вообще близнецы-братья, за исключением мелких деталей), и только голоса одной Партии (и вы ее знаете) ведут себя по-другому. Чтобы понять, как "по-другому", попытаемся снова выделить из голосов ЕдРа "нормальную" и "аномальную" части: нормальной будем считать компоненту, пропорциональную суммарному распределению голосов за "остальные" партии, а аномальной - то, что останется. Коэффициент пропорциональности подбираем так, чтобы аномальная часть была неотрицательна. Получается следующее:

Синяя линия - распределение голосов за "остальные" партии, зеленая - собственно "нормальная" часть голосов за ЕдРо (синее распределение*подгоночный коэффициент 0.85), лиловая линия - аномальная часть голосов.
В согласии со сказанным ранее при малых явках аномальная часть отсутствует и появляется в районе явки 20%.
Для контроля попробуем проделать ту же процедуру с голосами за КПРФ, разделив их на нормальную и аномальную части. Получается вот что:

При таком значении подгоночного коэффициента предполагаемая аномальная часть равна 0 в широком диапазоне явок, и лишь при относительно высоких явках немного проваливается в минус.
Практически аномальной части нет, что и оправдывает в некоторой степени наш подход.
Если теперь предположить, что аномальная часть голосов ЕдРа - это то, что накидали в ящики, и вычесть ее, получим следующие результаты голосования:
Явка: 22.02%
Распределение голосов:
ЛДПР: 9.82%
ПатРос: 2.90%
ЕдРос: 45.95%
КПРФ: 21.29%
СпРос: 8.54%
Яблоко: 7.54%
Недействительные бюллетени: 3.97%
Конкретные числа зависят от выбора подгоночного коэффициента при нормальной части, но в пределах разумных отклонений ситуация принципиально не меняется: в думу проходят пять партий из шести, а не две, и совсем с другим распределением мест.
UPD Умные люди нашли ошибку в моем расчете: откорректированная явка не 19.49%, а 22.02%. Исправил. На другие результаты не влияет.
Итак, распределения голосов в зависимости от явки:
Как и в предыдущих анализах, видно, что голоса за все партии распределены по явкам очень похоже (ЛДПР, СпРос и Яблоко - вообще близнецы-братья, за исключением мелких деталей), и только голоса одной Партии (и вы ее знаете) ведут себя по-другому. Чтобы понять, как "по-другому", попытаемся снова выделить из голосов ЕдРа "нормальную" и "аномальную" части: нормальной будем считать компоненту, пропорциональную суммарному распределению голосов за "остальные" партии, а аномальной - то, что останется. Коэффициент пропорциональности подбираем так, чтобы аномальная часть была неотрицательна. Получается следующее:
Синяя линия - распределение голосов за "остальные" партии, зеленая - собственно "нормальная" часть голосов за ЕдРо (синее распределение*подгоночный коэффициент 0.85), лиловая линия - аномальная часть голосов.
В согласии со сказанным ранее при малых явках аномальная часть отсутствует и появляется в районе явки 20%.
Для контроля попробуем проделать ту же процедуру с голосами за КПРФ, разделив их на нормальную и аномальную части. Получается вот что:
При таком значении подгоночного коэффициента предполагаемая аномальная часть равна 0 в широком диапазоне явок, и лишь при относительно высоких явках немного проваливается в минус.
Практически аномальной части нет, что и оправдывает в некоторой степени наш подход.
Если теперь предположить, что аномальная часть голосов ЕдРа - это то, что накидали в ящики, и вычесть ее, получим следующие результаты голосования:
Явка: 22.02%
Распределение голосов:
ЛДПР: 9.82%
ПатРос: 2.90%
ЕдРос: 45.95%
КПРФ: 21.29%
СпРос: 8.54%
Яблоко: 7.54%
Недействительные бюллетени: 3.97%
Конкретные числа зависят от выбора подгоночного коэффициента при нормальной части, но в пределах разумных отклонений ситуация принципиально не меняется: в думу проходят пять партий из шести, а не две, и совсем с другим распределением мест.
UPD Умные люди нашли ошибку в моем расчете: откорректированная явка не 19.49%, а 22.02%. Исправил. На другие результаты не влияет.
no subject
Date: 2009-10-13 01:09 pm (UTC)Восстановленные результаты интересны, это второй важнейший результат (первый был уже на вчерашнем графике).
Третий результат - правдоподобность того, что был именно вброс, а не просто нарисованные цифры. Во всяком случае на этих выборах.
no subject
Date: 2009-10-13 01:13 pm (UTC)no subject
Date: 2009-10-13 05:31 pm (UTC)Однако не будь этих постов ничего бы не произошло; поэтому я благодарен за труд, включающий и решение, и осуществление.
no subject
Date: 2009-10-13 05:11 pm (UTC)no subject
Date: 2009-10-13 06:08 pm (UTC)no subject
Date: 2009-10-13 06:15 pm (UTC)no subject
Date: 2009-10-13 06:52 pm (UTC)no subject
Date: 2009-10-13 07:26 pm (UTC)Наверное, году в 2003-м и раньше части регионов могли быть проявления административного ресурса за КПРФ, но сейчас система значительно упростилась.
Хотелось бы, конечно, иметь формализованную процедуру, но пока не соображу как.
no subject
Date: 2009-10-14 06:56 am (UTC)Кривые для остальных партий правдоподобны? Для всех?
Можно ли считать, что их цифры взяты из подсчёта, или же все числа удивительны?
no subject
Date: 2009-10-14 07:13 am (UTC)Похоже, что до явок где-то в 50% результаты остальных партий действительно реальные. При более высоких явках (а это, видимо, самые отмороженные/задавленные комиссии) заметен существенный провал в результатах Яблока и небольшой у КПРФ. Что это - результат ручного отъема голосов или социологический эффект (например, эти отмороженные комиссии расположены в районах, где за Яблоко в принципе не голосуют; имхо - маловероятно) - требует более тонкого анализа.
По ВЦИОМовскому экзит-поллу (из статьи Орешкина и Козлова в сегодняшней Новой Газете) у ЕР 45%, КПРФ 18%, Яблока 14%, СпРос 11%, ЛДПР 8%.
no subject
Date: 2009-10-14 07:42 am (UTC)В принципе, уже студент, владеющий основами статистики, может раскидать числа так, что распознать их произвольность будет практически невозможно. То, что это не происходит, характеристика времени и процесса, и именно это меня интересует.
Блистательная победа была очевидна задолго до, а вот метод - это важно. Надеюсь.
Первый же напрашивающийся вопрос
Date: 2009-10-14 08:02 am (UTC)Первый же напрашивающийся ответ
Date: 2009-10-14 08:14 am (UTC)no subject
Date: 2009-10-15 10:28 pm (UTC)no subject
Date: 2009-10-16 06:24 am (UTC)no subject
Date: 2009-10-16 02:46 pm (UTC)no subject
Date: 2009-10-16 07:16 pm (UTC)no subject
Date: 2009-10-17 11:49 am (UTC)no subject
Date: 2009-10-17 01:28 pm (UTC)Вы попали в Топ-30 Зиуса!
Date: 2009-10-16 03:29 pm (UTC)Это очень положительное явление. Пожалуйста, продолжайте в том же духе. © Зиус
Пройди тест и узнай, сколько общих френдофф у вас с
tema! (http://xeus.ru/vip/tema.php)
no subject
Date: 2009-10-19 06:42 pm (UTC)А насколько корректно "цифирки" (точнее, цифры единиц процентных долей) характеризуют такие процессы? Вы проверяли свою методику шире?
Или вот если допустить, что один из параметров (голоса за ЕР) действительно в разы различается с прочими (голоса за др.партии), то корректно ли рассматривать их наравне? Ведь в малом диапазоне значений происходит "компрессия" соотношений, и, значит, аномальные и нормальные части у маргинальных параметров будут более подобны?
Пардон, если уже было, как-то так подумалось.
no subject
Date: 2009-10-19 07:02 pm (UTC)no subject
Date: 2009-10-19 08:11 pm (UTC)no subject
Date: 2009-10-19 08:27 pm (UTC)no subject
Date: 2009-10-19 08:36 pm (UTC)Точнее, произвольность этой процедуры, да.