podmoskovnik: (mill)
podmoskovnik ([personal profile] podmoskovnik) wrote2016-09-19 04:35 pm

90887 участков, 100655093 избирателей

Вся Россия.
Оценки скорректированных результатов практически не поменяись, см. предыдущий пост.

Обновленные картинки по регионам в https://drive.google.com/open?id=0ByFMnUnpIlriNmhaUlZoUFJteDA

(теперь в разрешении 600 dpi)

[identity profile] nonenoun.livejournal.com 2016-09-21 12:22 am (UTC)(link)
А где у Сергея упоминание распределения Гаусса? И при чём здесь распределение Максвелла?

[identity profile] vadim krasnobelmov (from livejournal.com) 2016-09-21 09:25 pm (UTC)(link)
Да вроде бы в недавнем (сегодняшнем) интервью НГ, он сам сказал заветные два слова (какой-то Гаусс и какая-то кривая, взято в кавычки). А так уж давно у всех впечаталось "Говорим Гаусс - имеем в виду Шпилькина, говорим Шпилькин - имеем в виду Гаусс". В общем нет желания копошиться в истории этого вопроса, но вот такие вот ассоциации проводит народ. И это плохо, потому что тут по определению не может быть нормального (гаусовоского) распределения, т.к. это распределение непрерывной случайной величены, но что-то мне подсказывает, что выборы должны описываться дискретными распределениями: биноминальным (которое уже упоминают в статье), Пуассона и даже Максвелла (оно может быть как дискретным, так и непрерывным), хотя они в принципе могут быть аппроксимированы нормальным распределнием. Но все это сферические кони в вакууме.
Я вообще не люблю до таких вещей докапываться, однако я наблюдаю, что у народа от всего этого кургом идет голова и мозги во все стороны летят, отчего формируется какое-то неправильное представление в том числе и о том, что такое Гаусс и куда его можно воткнуть. Я вообще много математикой занимаюсь, в частности статистикой и совсем в частности - задачами идентификации поэтому как-то все это немного напрягает.

Более того, цитирую опять тоже злосчастное интервью:
"-Российское общество весьма однородно: оно находится в однородном информационном поле, созданном телевизором, и мало различается по воспитанию и образованию. У нас нет особого расслоения на страты, которые могли бы вести себя политически по-разному. Исключение — условный «московский образованный класс» — это довольно узкая прослойка, которая в разной степени представлена в Москве, Санкт-Петербурге и некоторых других городах."

Вот это уже по меньше мере выглядит непрофессионально и с легким таким налетом элитаризма как минимум, а вообще это очевидно ложное предположение. Если и все теория "выявления фальсификаций" на этом построена, то вообще, вах!, выглядит уже как лженаука в чистом виде.

В общем "информационное поле" складывается не очень - вокруг этой работы образуется какая-то фигня не имеющая к науке никакого отношения, зато претендующая на сенсацию - это плохо. Тем более те же несчастные выборы в 2011 году уже даже исследованы, причем без вызова духа Гаусса - точно также как выявляются фальсификации в бухгалтерских документах в развитых странах. Ну да, есть там кое-где признаки каких-то фальсификаций, но ничего сенсационного.
Edited 2016-09-21 21:26 (UTC)

[identity profile] shultz-flory.livejournal.com 2016-09-22 10:07 am (UTC)(link)
Я вот что недопонял. Участки по явке должны быть распределены по нормальному закону, согласен. Но ведь по оси ординат не участки, а голоса. То есть это g(x) = k*x*f(x), где x — явка, f(x) — функция Гаусса.

[identity profile] vadim krasnobelmov (from livejournal.com) 2016-09-22 07:31 pm (UTC)(link)
Вот оно, то самое о чём я писал.
Так вот представьте что процесс выборов для конкретной партии это последовательность случайных событий, подчиняющихся распределению Бернулли, т.е. приходит голосующий n0 и либо голосует с вероятностью p за эту партию, либо не голосует с вероятностью q=1-p , затем приходит голосующий n1 и процесс повторяется, ну и т.д. до N. Собственно полученные в результате такого процесса партией голоса будут подчинятся биноминальному распределению, плотность распределения вероятности которой описывается как P =[N!/(N!-k!)] *p^k*q^(N-k), где k = 0,...,N. Как видите тут нет никакого Гаусса (кстати и сам Шпилькин с соавторами в статье для журнала яйцеголовых также пишет про биноминальное распределение, но тв той статье нет ничего сенсационного касательно наших выборов), я хз, но когда учился в универах, нам такую терминологическую вольность не позволяли - мешать дискретные и непрерывные. Разве что можно сказать, что это распределение может быть сапроксимировано нормальным распределением, однако работоспособность цпт надо еще доказать. Зато по характеру этого случайного процесса можно сказать что закон Бенфорда к нему можно применить.

Но все это сферовакуумные кони, т.к. во-первых я не видел, что бы все 100 миллионов избирателей выстраивались напротив одной урны и следовали друг за другом. Так что уже имеем в наличии множество независимых случайных событий, каждое из которых происходит на своем избирательном участке. А избирательные участки у нас абсолютно разные по численности избирателей - от 50 и до 3000 человек. Качественный состав тоже очень сильно разниться между разными участками (да и внутри больших участков избиратели тоже неоднородны), порой через дорогу переходишь и как буд-то в другой мир попал. Так что разные УИК будут выдавать своершенно разнные распределния, каждое со своими уникальными параметрами (p и n) этого распределения. В общем совокупное распределение будет однозначно многомодальным.

Во-вторых, встает вопрос получения этих самых данных, это вообще-то еще один случайны процесс, бюллютени то не стопочкой лежат, одна за другой.

Ну и самое интересное, это третье, собственно сам процесс выбора не является марковским, и тут уже начинает работать немного другая математика, несколько более сложная. В общем тут работы на диссертацию наверное. Я бы, например, не рискнул на коленках такое анализировать.

[identity profile] shultz-flory.livejournal.com 2016-09-22 07:56 pm (UTC)(link)
Ну, при больших n биномиальное переходит в нормальное, а n смело можно полагать большим. Тут вопросов у меня нет. Что касается g(x) = k*x*f(x), то это тоже колоколообразная кривая, похожая на гаусса.
Edited 2016-09-22 20:01 (UTC)

[identity profile] vadim krasnobelmov (from livejournal.com) 2016-09-23 12:45 am (UTC)(link)
Ну допустим, что спросить/сказать хотели, я немного не понял?

[identity profile] shultz-flory.livejournal.com 2016-09-23 05:08 am (UTC)(link)
Я в общем-то сам себе и ответил :)

[identity profile] nonenoun.livejournal.com 2016-09-22 08:10 pm (UTC)(link)
Ну да, есть там кое-где признаки каких-то фальсификаций, но ничего сенсационного.
Что вы имеете в виду? Что масштаб фальсификаций завышен?
3/4 сфальсифицированных результатов на выборах 2011 года в Москве - это сенсационно или нет?

[identity profile] vadim krasnobelmov (from livejournal.com) 2016-09-23 12:50 am (UTC)(link)
Т.е. Вы хотите сказать, что 75% голосов сфальсифицированно? В этом году план будет 150% теперь?
Пруфы, как посчитали? Бросили два кубика и поделили меньшее число на большее, так что ли?

[identity profile] nonenoun.livejournal.com 2016-09-23 02:01 am (UTC)(link)
Не 75% голосов, а результаты на 75% УИК. Подробнее: http://nonenoun.livejournal.com/2485.html
В этом году в Москве всё нормально, в отличие от остальной России.