Чуров и статистика
Jan. 23rd, 2012 01:20 pm![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
Кажется, Чуров все-таки хочет войти в науку. Мало ему распределения Чурова - он хочет себе еще и критерий Чурова.
Однако, как заметили в ЦИКе, окончательные выводы о перспективах Явлинского и Мезенцева делать еще рано. Дело в том, что при первой выборке изучаются только 400 тысяч подписей. И теперь комиссия проверит еще 200 тысяч – и общий результат может измениться. Как заявила нам член Центризбиркома Елена Дубровина, на втором этапе Григорий Явлинский сохраняет шанс – у него больше страховочных подписей, чем у Дмитрия Мезенцева. «Страховка» - это количество подписей, сданных на проверку сверх необходимых двух миллионов. У иркутского губернатора этот запас прочности совсем невелик, у основателя «Яблока» - довольно серьезный, что и может его спасти при дальнейшей проверке.
Хочу понять, в какой логике такое вообще возможно. Я могу представить только такой вариант:
У нас сдано 2 миллиона 86 тысяч 342 подписи. Мы выбираем из них 400 тысяч, обнаруживаем 26% брака (это, значит, примерно 104 тысячи).
Так, Григорий Алексеевич, говорим мы, кажись, у тебя подписи плохие. Щаз мы тебя еще внимательнее проверим. Берем еще 200 тысяч, смотрим (о чудо!) - ни одной подписи бракованной нет.
Ура! Значит, у нас всего 104000 плохих подписей из 2086342.
Вычитаем: 2086342 - 104000 = 1 982 342. До 2 миллионов не хватает всего-то 17658.
17658 делить на два миллиона - меньше одного процента. Нормально, Григорий! По критерию Чурова проходит. Мы тебя оставляем. Выбирайся на здоровье.
Или как?
UPD alex_farrier правильно заметил, что первая неофициально прошедшая со ссылкой н Интерфакс цифра в 26% от 400 тысяч - это точь-в-точь 5% от количества сданных Явлинским подписей (2.08 млн). Что делает эту комедию еще более позорной.
Однако, как заметили в ЦИКе, окончательные выводы о перспективах Явлинского и Мезенцева делать еще рано. Дело в том, что при первой выборке изучаются только 400 тысяч подписей. И теперь комиссия проверит еще 200 тысяч – и общий результат может измениться. Как заявила нам член Центризбиркома Елена Дубровина, на втором этапе Григорий Явлинский сохраняет шанс – у него больше страховочных подписей, чем у Дмитрия Мезенцева. «Страховка» - это количество подписей, сданных на проверку сверх необходимых двух миллионов. У иркутского губернатора этот запас прочности совсем невелик, у основателя «Яблока» - довольно серьезный, что и может его спасти при дальнейшей проверке.
Хочу понять, в какой логике такое вообще возможно. Я могу представить только такой вариант:
У нас сдано 2 миллиона 86 тысяч 342 подписи. Мы выбираем из них 400 тысяч, обнаруживаем 26% брака (это, значит, примерно 104 тысячи).
Так, Григорий Алексеевич, говорим мы, кажись, у тебя подписи плохие. Щаз мы тебя еще внимательнее проверим. Берем еще 200 тысяч, смотрим (о чудо!) - ни одной подписи бракованной нет.
Ура! Значит, у нас всего 104000 плохих подписей из 2086342.
Вычитаем: 2086342 - 104000 = 1 982 342. До 2 миллионов не хватает всего-то 17658.
17658 делить на два миллиона - меньше одного процента. Нормально, Григорий! По критерию Чурова проходит. Мы тебя оставляем. Выбирайся на здоровье.
Или как?
UPD alex_farrier правильно заметил, что первая неофициально прошедшая со ссылкой н Интерфакс цифра в 26% от 400 тысяч - это точь-в-точь 5% от количества сданных Явлинским подписей (2.08 млн). Что делает эту комедию еще более позорной.
no subject
Date: 2012-01-23 09:40 am (UTC)no subject
Date: 2012-01-23 09:49 am (UTC)no subject
Date: 2012-01-23 09:54 am (UTC)no subject
Date: 2012-01-23 10:01 am (UTC)no subject
Date: 2012-01-23 10:09 am (UTC)no subject
Date: 2012-01-23 10:02 am (UTC)no subject
Date: 2012-01-23 10:05 am (UTC)Представления о статистике у них фантастические.
no subject
Date: 2012-01-23 10:14 am (UTC)подозрительная конечно возня какая-то.. и кто-то ведь реально верит в эти проценты недействительных подписей.. то что они на самом деле такие..
no subject
Date: 2012-01-23 10:14 am (UTC)Пять процентов от общего количества (2086342) собранных подписей как раз равно 1о4 тысячам (104317). То есть, заранее говорится - дальше перепроверять бесполезно - Чуровские волшебники уже отработали на "все сто". Высококачественный дурдом.
Вероятность случайного совпадения, что количество объявленных "неправильными" подписей в проверенных 400 тысячах с точностью до третьего знака равна минимально необходимому количеству в 5 процентов от общего количества собранных подписей, слишком мала. И они поняли, что опять перестарались и начинают юлить и менять как фокусники цифры - уже вроде не 26 процентов, а 23, проходила инфа про 10. Достали идиоты.
no subject
Date: 2012-01-26 03:23 am (UTC)После проведение второй выборки из 200 тыс подписей оказолось 137 492 ксерокопии (из всех 600тыс).
Т.е. во второй выборке было 58тыс ксерокопий (p2>29%).
Можно посчитать вероятность того, что такое большое отклонение произойдет случайно, при условии, что выборка производилась случайно.
Так ксерокопии делаются не отдельных подписей, а листов, надо считать, что количество листов. Допустим на листе 20 подписей. Тогда в первой
Выборке n1=20 000 листов, а во второй n2=10 000.
Вероятность такого отклонения будет наибольшой, когда на самом деле было p=(p1*sqrt(n1)+p2*sqrt(n2))/(sqrt(n1)+sqrt(n2))=24% ксерокопий.
В этом случае отклонение в обоих случаях будет больше 12 сигм. То есть вероятность такого будет просто 0 с любой мыслемой точностью.
Я нигде не ошибся?
Возможным объяснением этому может быть, например, что выборка не была случайной. Например, если провереющие выбирали случайные коробки, а в коробке либо все листы нормальные, либо ксероксы, то такое могло быть.
no subject
Date: 2012-01-30 11:02 am (UTC)Такое их приложение чертовски трудно обосновать, зато критиковать может каждый специально обученный социополитолог.А ведь тема очень интересная. Неловко говорить, но математическая сторона вопроса заслоняет
общественно-политическую значимость. В начале марта данных ещё прибавится. Надо проработать модели, пока есть время.
И есть предположение, смутное, что "распределение Чурова" имеет шансы честно войти в науку наравне с распределениями Пуассона, Вейбулла, Коши и другими. Звучит невероятно, да. Но волшебство рассудком не понять.
P.S. Прошу не воспринимать этот текст, будто я кому-то подаю "ценные указания". И в мыслях не было. Но после прочтения он показался мне то ли нагловатым, то ли высокомерным, сам не пойму. Подумал, что пояснение не помешает.
Есть подозрение, что мы все ожидали от данных другого поведения. Сравнительно лёгкого разделения на "шум" и "регулярную составляющую". А на самом деле увидели нечто своеобразное, не желающее распадаться на "шум" и "закон". Да, на два шума процесс разлагается, и получается вроде правдоподобно, но чувство неудовлетворённости не отпускает. Как будто что-то упущено. Надо бы разобраться, тем более, что время близится.