Вот тут есть картинки, например: kobak.livejournal.com/104514.html . Я смотрел на положение максимальной плотности на двухмерных распределениях (процент Путина, явка). Она находится примерно на 60% явке и ~55--54% за Путина. Правда, там картинки по предварительным результатам.
Дальше идут всякие общетеоретические соображения. Фальсифицированная компонента распределения обладает более широким распределением, чем настоящия. Это хорошо видно при сравнении результатов по Москве за 2011 и 2012 годы. Из-за этого положение максимума смещается относительно слабо.
Для оценки сдвига предположим, что доля участков с нечестным подсчётом R=r/(1+r) (r=R/(1-R)), ширины распределений w и W (дисперсии), а сами распределения для оценки примем гауссовскими. Тогда плотности для двух мод в их центрах относятся как r*(w/W)^n, где n -- размерность исследуемого распределения. У нас 2-мерное, так что n=2 (если фальсификации -- не только вбросы -- для только вбросов n=1). В случае r<<(W/w)^n (наш случай в 2012) плотность в пике честной моды будет больше, чем в пике фальсифицированной.
Когда сдвиг меньше w, можно гаусс у честного пика разложить до квадратичных членов, и оценить сверху сдвиг максимума за счёт фальсифицированных голосов как w*r*(w/W)^(n+1)*exp(-1/2) (максимальный сдвиг, когда расстояние между центрами мод равно W). Значение exp(-1/2)=0.6. Если взять параметры w=5% (померено для выборов 2012 на глаз по расстоянию уменьшения плотности в exp(1/2) раз), W>=7%, n>=1, r<=1 (т.е. плохих УИК не больше 50%), получим сдвиг <=0.3w=1.5% в 2012 году. Для n>=2 было бы <=1%, но распределения всё-таки выглядят, как будто вбросов по сравнению с переписыванием голосов было не мало. Так что брать n>=2 для выборов 2012 особых оснований нет: тут что-то промежуточное между n=1 и n=2.
Ещё вещь, на которую я хочу обратить внимание,-- что отношение ширин w/W стоит в степени (n+1), т.е. для 2-мерных распределений сдвиг максимума будет меньше, чем для 1-мерных в w/W раз. Так что когда фальсифицированная мода на 2-мерных распределениях растянута не только в длину (как для вбросов), но и в ширину, на 2-мерных распределениях фальсифицированная компонента должна заметно меньше влиять на положение максимума, чем на 1-мерных. Т.е. при наличии достаточной статистики 2-мерные распределения информативнее.
no subject
Date: 2013-03-13 01:00 pm (UTC)Дальше идут всякие общетеоретические соображения.
Фальсифицированная компонента распределения обладает более широким распределением, чем настоящия. Это хорошо видно при сравнении результатов по Москве за 2011 и 2012 годы. Из-за этого положение максимума смещается относительно слабо.
Для оценки сдвига предположим, что доля участков с нечестным подсчётом R=r/(1+r) (r=R/(1-R)), ширины распределений w и W (дисперсии), а сами распределения для оценки примем гауссовскими. Тогда плотности для двух мод в их центрах относятся как r*(w/W)^n, где n -- размерность исследуемого распределения. У нас 2-мерное, так что n=2 (если фальсификации -- не только вбросы -- для только вбросов n=1). В случае r<<(W/w)^n (наш случай в 2012) плотность в пике честной моды будет больше, чем в пике фальсифицированной.
Когда сдвиг меньше w, можно гаусс у честного пика разложить до квадратичных членов, и оценить сверху сдвиг максимума за счёт фальсифицированных голосов как w*r*(w/W)^(n+1)*exp(-1/2) (максимальный сдвиг, когда расстояние между центрами мод равно W). Значение exp(-1/2)=0.6. Если взять параметры w=5% (померено для выборов 2012 на глаз по расстоянию уменьшения плотности в exp(1/2) раз), W>=7%, n>=1, r<=1 (т.е. плохих УИК не больше 50%), получим сдвиг <=0.3w=1.5% в 2012 году. Для n>=2 было бы <=1%, но распределения всё-таки выглядят, как будто вбросов по сравнению с переписыванием голосов было не мало. Так что брать n>=2 для выборов 2012 особых оснований нет: тут что-то промежуточное между n=1 и n=2.
Ещё вещь, на которую я хочу обратить внимание,-- что отношение ширин w/W стоит в степени (n+1), т.е. для 2-мерных распределений сдвиг максимума будет меньше, чем для 1-мерных в w/W раз. Так что когда фальсифицированная мода на 2-мерных распределениях растянута не только в длину (как для вбросов), но и в ширину, на 2-мерных распределениях фальсифицированная компонента должна заметно меньше влиять на положение максимума, чем на 1-мерных. Т.е. при наличии достаточной статистики 2-мерные распределения информативнее.