Чуров и статистика
Jan. 23rd, 2012 01:20 pm![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
Кажется, Чуров все-таки хочет войти в науку. Мало ему распределения Чурова - он хочет себе еще и критерий Чурова.
Однако, как заметили в ЦИКе, окончательные выводы о перспективах Явлинского и Мезенцева делать еще рано. Дело в том, что при первой выборке изучаются только 400 тысяч подписей. И теперь комиссия проверит еще 200 тысяч – и общий результат может измениться. Как заявила нам член Центризбиркома Елена Дубровина, на втором этапе Григорий Явлинский сохраняет шанс – у него больше страховочных подписей, чем у Дмитрия Мезенцева. «Страховка» - это количество подписей, сданных на проверку сверх необходимых двух миллионов. У иркутского губернатора этот запас прочности совсем невелик, у основателя «Яблока» - довольно серьезный, что и может его спасти при дальнейшей проверке.
Хочу понять, в какой логике такое вообще возможно. Я могу представить только такой вариант:
У нас сдано 2 миллиона 86 тысяч 342 подписи. Мы выбираем из них 400 тысяч, обнаруживаем 26% брака (это, значит, примерно 104 тысячи).
Так, Григорий Алексеевич, говорим мы, кажись, у тебя подписи плохие. Щаз мы тебя еще внимательнее проверим. Берем еще 200 тысяч, смотрим (о чудо!) - ни одной подписи бракованной нет.
Ура! Значит, у нас всего 104000 плохих подписей из 2086342.
Вычитаем: 2086342 - 104000 = 1 982 342. До 2 миллионов не хватает всего-то 17658.
17658 делить на два миллиона - меньше одного процента. Нормально, Григорий! По критерию Чурова проходит. Мы тебя оставляем. Выбирайся на здоровье.
Или как?
UPD alex_farrier правильно заметил, что первая неофициально прошедшая со ссылкой н Интерфакс цифра в 26% от 400 тысяч - это точь-в-точь 5% от количества сданных Явлинским подписей (2.08 млн). Что делает эту комедию еще более позорной.
Однако, как заметили в ЦИКе, окончательные выводы о перспективах Явлинского и Мезенцева делать еще рано. Дело в том, что при первой выборке изучаются только 400 тысяч подписей. И теперь комиссия проверит еще 200 тысяч – и общий результат может измениться. Как заявила нам член Центризбиркома Елена Дубровина, на втором этапе Григорий Явлинский сохраняет шанс – у него больше страховочных подписей, чем у Дмитрия Мезенцева. «Страховка» - это количество подписей, сданных на проверку сверх необходимых двух миллионов. У иркутского губернатора этот запас прочности совсем невелик, у основателя «Яблока» - довольно серьезный, что и может его спасти при дальнейшей проверке.
Хочу понять, в какой логике такое вообще возможно. Я могу представить только такой вариант:
У нас сдано 2 миллиона 86 тысяч 342 подписи. Мы выбираем из них 400 тысяч, обнаруживаем 26% брака (это, значит, примерно 104 тысячи).
Так, Григорий Алексеевич, говорим мы, кажись, у тебя подписи плохие. Щаз мы тебя еще внимательнее проверим. Берем еще 200 тысяч, смотрим (о чудо!) - ни одной подписи бракованной нет.
Ура! Значит, у нас всего 104000 плохих подписей из 2086342.
Вычитаем: 2086342 - 104000 = 1 982 342. До 2 миллионов не хватает всего-то 17658.
17658 делить на два миллиона - меньше одного процента. Нормально, Григорий! По критерию Чурова проходит. Мы тебя оставляем. Выбирайся на здоровье.
Или как?
UPD alex_farrier правильно заметил, что первая неофициально прошедшая со ссылкой н Интерфакс цифра в 26% от 400 тысяч - это точь-в-точь 5% от количества сданных Явлинским подписей (2.08 млн). Что делает эту комедию еще более позорной.
no subject
Date: 2012-01-26 03:23 am (UTC)После проведение второй выборки из 200 тыс подписей оказолось 137 492 ксерокопии (из всех 600тыс).
Т.е. во второй выборке было 58тыс ксерокопий (p2>29%).
Можно посчитать вероятность того, что такое большое отклонение произойдет случайно, при условии, что выборка производилась случайно.
Так ксерокопии делаются не отдельных подписей, а листов, надо считать, что количество листов. Допустим на листе 20 подписей. Тогда в первой
Выборке n1=20 000 листов, а во второй n2=10 000.
Вероятность такого отклонения будет наибольшой, когда на самом деле было p=(p1*sqrt(n1)+p2*sqrt(n2))/(sqrt(n1)+sqrt(n2))=24% ксерокопий.
В этом случае отклонение в обоих случаях будет больше 12 сигм. То есть вероятность такого будет просто 0 с любой мыслемой точностью.
Я нигде не ошибся?
Возможным объяснением этому может быть, например, что выборка не была случайной. Например, если провереющие выбирали случайные коробки, а в коробке либо все листы нормальные, либо ксероксы, то такое могло быть.