Выборы и математика. Или статистика рулит !

На модерации Отложенный

Статья написана специально для макспарка.

Здравствуйте уважаемые макспаркеры ! До выборов осталось три дня. Тема уже сто раз говорена переговорена. И страсти здесь кипели мама не горюй ! Однако есть в этой теме один момент, который пока на макспарке не обсуждался. Вообще-то эту статью мне следовало опубликовать неделю назад, а лучше того месяц. Но уж вышло как вышло, лучше поздно чем никогда.

Итак выборы. Как и многое, да по сути почти всё, в нашей жизни, это штука во многом случайная, статистическая. По сути это просто очень большой социологический опрос, в котором принимает участие всё население страны. И имеющий большое значение для будущего. Вспомните опросы того же ВЦИОМа. Там всегда ссылаются на репрезентативность, статистическую погрешность и т.п. Оно и понятно, ведь респонденты там выбираются случайно. Но та же случайность присутствует и на больших выборах ! Кто-то заболел. Кто-то уехал в отпуск. Кто-то решил за кого он будет голосовать только  в последние пять секунд... Всё случайно. Ничего нельзя предсказать заранее абсолютно точно.

 

Все случайные процессы и явления, оставляют свой характерный след. Некую кривую похожую на колокол и называемую кривой Гаусса. Возможно Вы уже слышали это название. Прежде чем переходить непосредственно к выборам, давайте посмотрим как это получается.

 

Это результат работы компьютерной программы, моделирующей бросание игральной кости. 1000 серий по 1000 бросков. В каждой серии складываются выпавшие очки. Вы можете сколько угодно раз запускать эту программу. Картинка всегда будет получаться разной. Однако суть её будет всегда одна. В центре густо, по краям пусто. А саму гистограмму можно обвести кривой, похожей на колокол. Очевидно если выборы явление во многом случайное, то и в данных по ним мы должны увидеть что-то похожее. Если же мы увидим что-то сильно не похожее на колокол, значит и с  выборами что-то совсем не то.

 

Есть на свете такой замечательный сайт http://www.izbirkom.ru/region/izbirkom. Говорят на его создание потратили кучу денег. Но ей богу оно того стоило ! И хотя он и не выдаёт непосредственно данных в пригодном для компьютерного анализа виде, а написать программу, за разумное время скачивающую с него такие данные, дело не самое простое, пытливого исследователя это не останавливает. Такая программа мной написана. Она читает данные по выборам с сайта и сохраняет их в виде базы данных формата sqlite. Для примера я взял выборы 2008-го года. Давайте загрузим их данные и попробуем поглядеть на полученные картинки.

 

Сначала построим простейшие гистограммы, где  по горизонтальной оси отложена явка либо процент одного из кандидатов, а по вертикальной - количество участковых избирательных комиссий(УИКов), где была такая явка или такой процент у кандидата.

 

явка

bog

 

girzug

med

Приемлемой с точки зрения статистики тут выглядит только картинка Богданова. Она не похожа на колокол, но просто голосование за него было очень редким событием. И мало где вообще кто либо за него голосовал. Поэтому и максимум в нуле. Картинки Зюганова и Жириновского странным образом возрастают к нулю. Что наводит на сильные подозрения о том, что голоса у них отбирались. И уж совсем фантасмогорически выглядят картинки явки и Медведева. Вместо того, чтобы как и положено любому уважающему себя статистическому распределению, спадать к правому краю, они к правому краю РАСТУТ !  Картинка Медведева имеет ещё одну интересную особенность.  Обратите внимание, весь правый склон кривой изрезан чёткими маленькими пичками. К сожалению здесь на макспарке этого увидеть нельзя, но значения процента, при которых получаются эти пички, образуют интересный ряд - 70, 75, 80, 85, 90, 95 и 98. Все пички кроме последнего образуются при процентах строго кратных пяти ! Вопрос о природе этих пичков обсуждается уже давно. Дело в том, что видны они не только на президентских выборах 2008-го, а вообще на ВСЕХ выборах, проводившихся в России. Предлагались различные гипотезы. И об ошибках округления на УИКах с малым числом избирателей. И о неслучайных результатах арифметических операций со случайными числами, и многое другое. Но мне трудно всё это себе представить. А вот тупого местного чинушу, гоняющего бедных училок из УИКов, чтобы вывели ему красивую цифру за Главного Кандидата(или партию) - легко. Как видите, статистика видит даже это...

 

В целом вид картинок этих выборов позволяет заподозрить масштабные и массовые фальсификации. В то же время говорить, что выборы сфальсифицированы  ТОТАЛЬНО, тоже нельзя. Посмотрите внимательно на картинку Медведева. Наибольшее число УИКов приходится на те, где он набрал скромные 63%, а не 146, как можно было ожидать. А есть и УИКи(к сожалению в картинке на макспарке этого не видно), где Медведев набрал и менее 20 !  Пички же на его картинке говорят о том, что все фальсификации делаются исключительно на местах.

Без какого либо спущенного сверху общего плана. Ведь если бы враньё было централизованным, мы бы видели на картинке предпочтения заказчиков этого вранья. Вместо этого мы видим разнобой. Кто-то из махинаторов считает что сможет выслужиться обеспечив жалкие 70%. А кто-то не мелочится и выдаёт сразу 95 (98 скорее всего просто результат краевого эффекта).

 

Следующую серию картинок мы нарисуем так. Посчитаем общее число голосов, полученных кандидатом на УИКах с определённой явкой. По горизонтальной оси отложим явку. А по вертикальной - сумму голосов.

 

bg

gr

 

zf

md

Обратите внимание, насколько похожи друг на друга картинки Богданова, Жириновского и Зюганова ! Настолько, что их трудно различить на глаз. Приходится специально приглядываться к мелким деталям. Тем не менее разница в масштабах между ними более 10 раз ! У Богданова в максимуме 30 тысяч голосов, у Жириновского 200, у Зюганова 400. И такое потрясающее сходство...  Левые склоны этих картинок похожи на идеальные колокола. Правые склоны искажены. Они сильно растянуты вправо и изрезаны пичками. Но сильно растянута вправо и изрезана пичками и сама явка (см. первую серию картинок). Поэтому в целом про эти картинки можно сказать, что они полностью соответствуют нашим ожиданиям, исходящим из представления о выборах, как о случайном процессе.

 

Картинка Медведева снова резко отличается от всех остальных. Однако внимательно к ней приглядевшись, видим, что в начале явно пытается нарисоваться что-то очень похожее на то, что мы видим у других кандидатов ! И даже совершенно чётки локальный максимум имеется при точно тех же 63% явки, что и у остальных ! Но начиная с явки 65%, происходит что-то не то...

 

Примем следующую гипотезу. Голосование за Медведева складывается из двух частей. Нормальной и аномальной. Причём нормальная часть в зависимости от явки ведёт себя точно так же, как для остальных кандидатов, отличаясь от них только масштабом. А аномальная представляет собой исключительно вбросы, карусели, голосования  бюджетников и студентов и т.п. Построим суммарную картинку, трёх остальных кандидатов. Это даст нам усреднённую картину нормального голосования. Сравним её значение в максимуме (явка 63%) со значением картинки при той же явке для Медведева. Это даст нам разницу в масштабах. Построим кривую точно такую же как наша суммарная, но с масштабом под Медведева. Это и будет нашей оценочной кривой нормального голосования за него. Разница между нашей оценочной и реальной кривой, это и есть фальсификации. Для наглядности построим все три кривых на одном графике

  

а

 

Видно, что при умеренных явках наша оценка почти идеально совпадает с реальными данными. А значит наша гипотеза блестяще подтверждается !

Теперь у нас есть всё, чтобы посчитать количество вбросов на этих выборах и получить их истинные итоги. Для этого просто просуммируем кривую вбросов по всем значением явки и вычтем полученную сумму вбросов из итоговой явки и голосов за Медведева. Получается следующий результат:

Официальные результаты:

Явка 69.81%

Богданов Андрей Владимирович 1.30%

Жириновский Владимир Вольфович 9.35%

Зюганов Геннадий Андреевич 17.72%

Медведев Дмитрий Анатольевич 70.28%

Реальные результаты:

Явка 57.27%

Богданов Андрей Владимирович 1.58%

Жириновский Владимир Вольфович 11.40%

Зюганов Геннадий Андреевич 21.60%

Медведев Дмитрий Анатольевич 63.76%

Вбросы: 13446081

Как видите, нет ничего тайного, что рано или поздно не стало бы явным. Причём в наш компьютерный век делается это весьма простыми и доступными средствами. Помнится Зюганов что-то говорил о 600 тысячах голосов, вброшенных за Ельцина в 96-м. Либо он сильно поскромничал, либо с тех пор ребята вошли во вкус. А 13 с половиной миллионов не хотите ! 12.5% ВСЕГО (!!!) списочного состава избирателей !

Важное замечание. Оценка результата Медведева здесь на самом деле завышена. Вспомните картинки первой серии, серьёзно намекающие на то, что голоса у Зюганова и Жириновского отбирались. К сожалению я не знаю как это оценить, не в водя достаточно спорных, а главное никак не проверяемых предположений. Например о строгой гауссовости соответствующих кривых.  Однако следует помнить, что реальный результат Медведева ещё ниже. И возможно значительно.

На этом пожалуй всё. Продолжение следует как только на сайте избиркома появятся данные по выборам 18 марта. Тогда же выложу в открытый доступ исходники всех своих программ, чтобы убедиться в полученных результатов смог каждый.

 

Внимание ! По многочисленным просьбам трудящихся выложил архив. Там базы данных за 2004, 2008 и 2012-й годы, сами рассчеты и инструкция, как ставить и запускать необходимый софт. Это предварительная версия, без загрузчика. Окончательную выложу уже после выборов. Скорее всего на гитхабе. Взять архив можно здесь - https://yadi.sk/d/lBaZvOul3TPDKH