podmoskovnik (
podmoskovnik) wrote2012-01-23 01:20 pm
![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
Entry tags:
Чуров и статистика
Кажется, Чуров все-таки хочет войти в науку. Мало ему распределения Чурова - он хочет себе еще и критерий Чурова.
Однако, как заметили в ЦИКе, окончательные выводы о перспективах Явлинского и Мезенцева делать еще рано. Дело в том, что при первой выборке изучаются только 400 тысяч подписей. И теперь комиссия проверит еще 200 тысяч – и общий результат может измениться. Как заявила нам член Центризбиркома Елена Дубровина, на втором этапе Григорий Явлинский сохраняет шанс – у него больше страховочных подписей, чем у Дмитрия Мезенцева. «Страховка» - это количество подписей, сданных на проверку сверх необходимых двух миллионов. У иркутского губернатора этот запас прочности совсем невелик, у основателя «Яблока» - довольно серьезный, что и может его спасти при дальнейшей проверке.
Хочу понять, в какой логике такое вообще возможно. Я могу представить только такой вариант:
У нас сдано 2 миллиона 86 тысяч 342 подписи. Мы выбираем из них 400 тысяч, обнаруживаем 26% брака (это, значит, примерно 104 тысячи).
Так, Григорий Алексеевич, говорим мы, кажись, у тебя подписи плохие. Щаз мы тебя еще внимательнее проверим. Берем еще 200 тысяч, смотрим (о чудо!) - ни одной подписи бракованной нет.
Ура! Значит, у нас всего 104000 плохих подписей из 2086342.
Вычитаем: 2086342 - 104000 = 1 982 342. До 2 миллионов не хватает всего-то 17658.
17658 делить на два миллиона - меньше одного процента. Нормально, Григорий! По критерию Чурова проходит. Мы тебя оставляем. Выбирайся на здоровье.
Или как?
UPD alex_farrier правильно заметил, что первая неофициально прошедшая со ссылкой н Интерфакс цифра в 26% от 400 тысяч - это точь-в-точь 5% от количества сданных Явлинским подписей (2.08 млн). Что делает эту комедию еще более позорной.
Однако, как заметили в ЦИКе, окончательные выводы о перспективах Явлинского и Мезенцева делать еще рано. Дело в том, что при первой выборке изучаются только 400 тысяч подписей. И теперь комиссия проверит еще 200 тысяч – и общий результат может измениться. Как заявила нам член Центризбиркома Елена Дубровина, на втором этапе Григорий Явлинский сохраняет шанс – у него больше страховочных подписей, чем у Дмитрия Мезенцева. «Страховка» - это количество подписей, сданных на проверку сверх необходимых двух миллионов. У иркутского губернатора этот запас прочности совсем невелик, у основателя «Яблока» - довольно серьезный, что и может его спасти при дальнейшей проверке.
Хочу понять, в какой логике такое вообще возможно. Я могу представить только такой вариант:
У нас сдано 2 миллиона 86 тысяч 342 подписи. Мы выбираем из них 400 тысяч, обнаруживаем 26% брака (это, значит, примерно 104 тысячи).
Так, Григорий Алексеевич, говорим мы, кажись, у тебя подписи плохие. Щаз мы тебя еще внимательнее проверим. Берем еще 200 тысяч, смотрим (о чудо!) - ни одной подписи бракованной нет.
Ура! Значит, у нас всего 104000 плохих подписей из 2086342.
Вычитаем: 2086342 - 104000 = 1 982 342. До 2 миллионов не хватает всего-то 17658.
17658 делить на два миллиона - меньше одного процента. Нормально, Григорий! По критерию Чурова проходит. Мы тебя оставляем. Выбирайся на здоровье.
Или как?
UPD alex_farrier правильно заметил, что первая неофициально прошедшая со ссылкой н Интерфакс цифра в 26% от 400 тысяч - это точь-в-точь 5% от количества сданных Явлинским подписей (2.08 млн). Что делает эту комедию еще более позорной.
no subject
После проведение второй выборки из 200 тыс подписей оказолось 137 492 ксерокопии (из всех 600тыс).
Т.е. во второй выборке было 58тыс ксерокопий (p2>29%).
Можно посчитать вероятность того, что такое большое отклонение произойдет случайно, при условии, что выборка производилась случайно.
Так ксерокопии делаются не отдельных подписей, а листов, надо считать, что количество листов. Допустим на листе 20 подписей. Тогда в первой
Выборке n1=20 000 листов, а во второй n2=10 000.
Вероятность такого отклонения будет наибольшой, когда на самом деле было p=(p1*sqrt(n1)+p2*sqrt(n2))/(sqrt(n1)+sqrt(n2))=24% ксерокопий.
В этом случае отклонение в обоих случаях будет больше 12 сигм. То есть вероятность такого будет просто 0 с любой мыслемой точностью.
Я нигде не ошибся?
Возможным объяснением этому может быть, например, что выборка не была случайной. Например, если провереющие выбирали случайные коробки, а в коробке либо все листы нормальные, либо ксероксы, то такое могло быть.