Скачивал год назад с http://www.infocenter.gov.az/v3/index.php, только сейчас дошли руки свести в одну таблицу. Сейчас на этой странице другие выборы, а где взять те - не знаю. Надо спросить человека с языком.
Если надо, могу прислать исходные Excel-таблицы, скопированные со страниц сайта. Кстати, поскольку Вам это ближе. Я правильно понимаю, что во всех округах победили представители одной партии? Тогда можно проделать еще один анализ.
Наши люди в простых дробях не мыслят и не отчитываются. У них в голове десятичный калькулятор. Я думаю, не каждый с налету скажет, сколько будет 2/3 в процентах.
Сумма достаточно большого количества слабо зависимых случайных величин, имеющих примерно одинаковые масштабы (ни одно из слагаемых не доминирует, не вносит в сумму определяющего вклада), имеет распределение, близкое к нормальному.
О том и речь что в других странах и у других российских партий результаты имеют нормальное распределение (см. http://podmoskovnik.livejournal.com/133805.html, http://www.gazeta.ru/science/2011/12/10_a_3922390.shtml), следовательно, в тех случаях эти условия выполняются. У ЕдРа же это не так, следовательно либо результаты ЕдРа не случайные величины, либо не слабозависимые между собой. Ну слабая зависимость, очевидно, выполняется т.к. результаты на разных участках между собой не взаимосвязаны. Получается, что мы имеем дело не со случайными величинами, т.е. тут какое-то волшебство замешано)).
Из того, что где-то распределение близко к нормальному, вовсе не следует, что там что-то независимо. И наборот, если в одном месте люди в основном за едро голосуют, а в другом в основном за кпрф, суммарное распределение вовсе необязано быть нормальным, хотя это можно считать за случайные переменные.
1. Голосования на различных участках друг от друга не зависят, по-моему, это очевидно независимо от того есть фальсификации или нет. 2. Смоделируем отдельно взятый участок. Можно сказать что каждый избиратель подбрасывает монетку и, скажем, если выпала решка идет на участок, а если орел то нет. Понятно что в нашем случае эта аналогия не совсем верна, т.к. орел и решка будут выпадать не 50/50, как в случае с монеткой. Но поскольку все избиратели на одном участке проживают компактно, то принятие решения о том идти на выборы или нет они принимают исходя из примерно одних предпосылок, поэтому для каких-то участков эта вероятность будет, например, 40/60, для других какая-то другая. Это не имеет значения, важно что решение придти на выборы является случайной величиной, избирателей много, их решение идти или нет на выборы независимы (можно взять не отдельных избирателей, а, например, семьи, это не важно), случайные величины одного порядка. Поэтому, по центральной предельной теореме, явка на каждом участке является нормально распределенной случайной величиной. Тоже самое можно сказать и про голосование за какую-то партию на данном участке. 3. Сумма любого количества нормально распределенных случайных величин также является нормально распределенной случайной величиной. В реальности же мы видим совсем другую картину. Особенно забавно выглядят пики через каждые 5% в правой части графиков.
1. Это с чего это вдруг? Почему вы считаете, что случайные переменные, выражающие голосования на разных участках, независимы? 2. Опять, почему случайные переменные, выражающие решения разных избирателей (или групп избирателей), независимы? 3. А что вы считаете нормально распределенными случайными величинами, сумму которых вы считаете?
1. Это никак не используется в п. 2,3, так что нет смысла спорить по поводу этого утверждения. 2. Возьмем, например, 1000 человек которых заставляют голосовать за ЕдРо. Понятно что в реальности, если голосование тайное, то кто-то проголосует против и сумма всех голосов за ЕдРо таким образом, даже в этом случае будет иметь нормальное распределение. Никакого другого тут просто не может получиться, т.к. как бы не было велико давление, это отражается только на вероятности голосования "за", распределение будет более вытянуто вверх при большем давлении, но останется нормальным. 3. Процент явки на участке будет иметь нормальное распределение исходя из того что он моделируется большой суммой независимых голосований избирателей. Можно брать какие-то срезы похожих избирателей, делить на какие-то участки, все это не важно, в итоге получится нормальное распределение, т.к. сумма нормальных распределений дает нормальное распределение, а во всех этих срезах будет так же получаться нормальное распределение (см. п. 2). 4. Задумайтесь еще почему нормальное распределение получается для других стран и других наших партий, но не получается для ЕдРа.
5. Я бы ещё добавил вопрос: почему более нормальное распределение за ЕдРо получается на участках с КОИБами (http://abuzin.livejournal.com/87116.html?thread=398668#t398668)?
no subject
Date: 2011-12-10 06:10 pm (UTC)no subject
Date: 2011-12-10 06:23 pm (UTC)no subject
Date: 2011-12-11 12:33 pm (UTC)не смог найти данные за 2010 год, наверное, убрали
no subject
Date: 2011-12-11 09:14 am (UTC)Кстати, поскольку Вам это ближе. Я правильно понимаю, что во всех округах победили представители одной партии? Тогда можно проделать еще один анализ.
no subject
Date: 2011-12-11 12:47 pm (UTC)у нас не было голосования по парийным спискам, так что анализ несколько другой потребуется.
а так, да, в большинстве округов победили представители партии Новый Азербайджан и сочувствующие ей независимые)
no subject
Date: 2011-12-10 06:58 pm (UTC)no subject
Date: 2011-12-11 07:12 am (UTC)no subject
Date: 2011-12-11 11:55 am (UTC)no subject
Date: 2011-12-11 12:17 pm (UTC)no subject
Date: 2011-12-11 12:34 pm (UTC)no subject
Date: 2011-12-10 07:31 pm (UTC)no subject
Date: 2011-12-10 07:40 pm (UTC)Сумма достаточно большого количества слабо зависимых случайных величин, имеющих примерно одинаковые масштабы (ни одно из слагаемых не доминирует, не вносит в сумму определяющего вклада), имеет распределение, близкое к нормальному.
no subject
Date: 2011-12-10 08:26 pm (UTC)no subject
Date: 2011-12-10 08:52 pm (UTC)no subject
Date: 2011-12-10 09:53 pm (UTC)no subject
Date: 2011-12-10 11:04 pm (UTC)1. Голосования на различных участках друг от друга не зависят, по-моему, это очевидно независимо от того есть фальсификации или нет.
2. Смоделируем отдельно взятый участок. Можно сказать что каждый избиратель подбрасывает монетку и, скажем, если выпала решка идет на участок, а если орел то нет. Понятно что в нашем случае эта аналогия не совсем верна, т.к. орел и решка будут выпадать не 50/50, как в случае с монеткой. Но поскольку все избиратели на одном участке проживают компактно, то принятие решения о том идти на выборы или нет они принимают исходя из примерно одних предпосылок, поэтому для каких-то участков эта вероятность будет, например, 40/60, для других какая-то другая. Это не имеет значения, важно что решение придти на выборы является случайной величиной, избирателей много, их решение идти или нет на выборы независимы (можно взять не отдельных избирателей, а, например, семьи, это не важно), случайные величины одного порядка. Поэтому, по центральной предельной теореме, явка на каждом участке является нормально распределенной случайной величиной. Тоже самое можно сказать и про голосование за какую-то партию на данном участке.
3. Сумма любого количества нормально распределенных случайных величин также является нормально распределенной случайной величиной. В реальности же мы видим совсем другую картину. Особенно забавно выглядят пики через каждые 5% в правой части графиков.
no subject
Date: 2011-12-11 12:51 am (UTC)2. Опять, почему случайные переменные, выражающие решения разных избирателей (или групп избирателей), независимы?
3. А что вы считаете нормально распределенными случайными величинами, сумму которых вы считаете?
no subject
Date: 2011-12-11 10:11 am (UTC)2. Возьмем, например, 1000 человек которых заставляют голосовать за ЕдРо. Понятно что в реальности, если голосование тайное, то кто-то проголосует против и сумма всех голосов за ЕдРо таким образом, даже в этом случае будет иметь нормальное распределение. Никакого другого тут просто не может получиться, т.к. как бы не было велико давление, это отражается только на вероятности голосования "за", распределение будет более вытянуто вверх при большем давлении, но останется нормальным.
3. Процент явки на участке будет иметь нормальное распределение исходя из того что он моделируется большой суммой независимых голосований избирателей. Можно брать какие-то срезы похожих избирателей, делить на какие-то участки, все это не важно, в итоге получится нормальное распределение, т.к. сумма нормальных распределений дает нормальное распределение, а во всех этих срезах будет так же получаться нормальное распределение (см. п. 2).
4. Задумайтесь еще почему нормальное распределение получается для других стран и других наших партий, но не получается для ЕдРа.
no subject
Date: 2011-12-11 09:10 pm (UTC)no subject
Date: 2011-12-12 11:41 am (UTC)есть данные по Германии по разным годам для федеральных выборов.
К сожалению, бесплатно только данные по избирательным округам (299) constituencies/Wahlkreise.
За данные по избирательным участкам polling districts/Wahlbezirke просят 95 евро.
no subject
Date: 2011-12-12 05:33 pm (UTC)