podmoskovnik (
podmoskovnik) wrote2016-09-19 04:35 pm
![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
90887 участков, 100655093 избирателей
Вся Россия.
Оценки скорректированных результатов практически не поменяись, см. предыдущий пост.
Обновленные картинки по регионам в https://drive.google.com/open?id=0ByFMnU
no subject
no subject
Так вот представьте что процесс выборов для конкретной партии это последовательность случайных событий, подчиняющихся распределению Бернулли, т.е. приходит голосующий n0 и либо голосует с вероятностью p за эту партию, либо не голосует с вероятностью q=1-p , затем приходит голосующий n1 и процесс повторяется, ну и т.д. до N. Собственно полученные в результате такого процесса партией голоса будут подчинятся биноминальному распределению, плотность распределения вероятности которой описывается как P =[N!/(N!-k!)] *p^k*q^(N-k), где k = 0,...,N. Как видите тут нет никакого Гаусса (кстати и сам Шпилькин с соавторами в статье для журнала яйцеголовых также пишет про биноминальное распределение, но тв той статье нет ничего сенсационного касательно наших выборов), я хз, но когда учился в универах, нам такую терминологическую вольность не позволяли - мешать дискретные и непрерывные. Разве что можно сказать, что это распределение может быть сапроксимировано нормальным распределением, однако работоспособность цпт надо еще доказать. Зато по характеру этого случайного процесса можно сказать что закон Бенфорда к нему можно применить.
Но все это сферовакуумные кони, т.к. во-первых я не видел, что бы все 100 миллионов избирателей выстраивались напротив одной урны и следовали друг за другом. Так что уже имеем в наличии множество независимых случайных событий, каждое из которых происходит на своем избирательном участке. А избирательные участки у нас абсолютно разные по численности избирателей - от 50 и до 3000 человек. Качественный состав тоже очень сильно разниться между разными участками (да и внутри больших участков избиратели тоже неоднородны), порой через дорогу переходишь и как буд-то в другой мир попал. Так что разные УИК будут выдавать своершенно разнные распределния, каждое со своими уникальными параметрами (p и n) этого распределения. В общем совокупное распределение будет однозначно многомодальным.
Во-вторых, встает вопрос получения этих самых данных, это вообще-то еще один случайны процесс, бюллютени то не стопочкой лежат, одна за другой.
Ну и самое интересное, это третье, собственно сам процесс выбора не является марковским, и тут уже начинает работать немного другая математика, несколько более сложная. В общем тут работы на диссертацию наверное. Я бы, например, не рискнул на коленках такое анализировать.
no subject
no subject
no subject