Выборы и математика. Или статистика рулит !
На модерации
Отложенный
Статья написана специально для макспарка.
Здравствуйте уважаемые макспаркеры ! До выборов осталось три дня. Тема уже сто раз говорена переговорена. И страсти здесь кипели мама не горюй ! Однако есть в этой теме один момент, который пока на макспарке не обсуждался. Вообще-то эту статью мне следовало опубликовать неделю назад, а лучше того месяц. Но уж вышло как вышло, лучше поздно чем никогда.
Итак выборы. Как и многое, да по сути почти всё, в нашей жизни, это штука во многом случайная, статистическая. По сути это просто очень большой социологический опрос, в котором принимает участие всё население страны. И имеющий большое значение для будущего. Вспомните опросы того же ВЦИОМа. Там всегда ссылаются на репрезентативность, статистическую погрешность и т.п. Оно и понятно, ведь респонденты там выбираются случайно. Но та же случайность присутствует и на больших выборах ! Кто-то заболел. Кто-то уехал в отпуск. Кто-то решил за кого он будет голосовать только в последние пять секунд... Всё случайно. Ничего нельзя предсказать заранее абсолютно точно.
Все случайные процессы и явления, оставляют свой характерный след. Некую кривую похожую на колокол и называемую кривой Гаусса. Возможно Вы уже слышали это название. Прежде чем переходить непосредственно к выборам, давайте посмотрим как это получается.
Это результат работы компьютерной программы, моделирующей бросание игральной кости. 1000 серий по 1000 бросков. В каждой серии складываются выпавшие очки. Вы можете сколько угодно раз запускать эту программу. Картинка всегда будет получаться разной. Однако суть её будет всегда одна. В центре густо, по краям пусто. А саму гистограмму можно обвести кривой, похожей на колокол. Очевидно если выборы явление во многом случайное, то и в данных по ним мы должны увидеть что-то похожее. Если же мы увидим что-то сильно не похожее на колокол, значит и с выборами что-то совсем не то.
Есть на свете такой замечательный сайт http://www.izbirkom.ru/region/izbirkom. Говорят на его создание потратили кучу денег. Но ей богу оно того стоило ! И хотя он и не выдаёт непосредственно данных в пригодном для компьютерного анализа виде, а написать программу, за разумное время скачивающую с него такие данные, дело не самое простое, пытливого исследователя это не останавливает. Такая программа мной написана. Она читает данные по выборам с сайта и сохраняет их в виде базы данных формата sqlite. Для примера я взял выборы 2008-го года. Давайте загрузим их данные и попробуем поглядеть на полученные картинки.
Сначала построим простейшие гистограммы, где по горизонтальной оси отложена явка либо процент одного из кандидатов, а по вертикальной - количество участковых избирательных комиссий(УИКов), где была такая явка или такой процент у кандидата.
Приемлемой с точки зрения статистики тут выглядит только картинка Богданова. Она не похожа на колокол, но просто голосование за него было очень редким событием. И мало где вообще кто либо за него голосовал. Поэтому и максимум в нуле. Картинки Зюганова и Жириновского странным образом возрастают к нулю. Что наводит на сильные подозрения о том, что голоса у них отбирались. И уж совсем фантасмогорически выглядят картинки явки и Медведева. Вместо того, чтобы как и положено любому уважающему себя статистическому распределению, спадать к правому краю, они к правому краю РАСТУТ ! Картинка Медведева имеет ещё одну интересную особенность. Обратите внимание, весь правый склон кривой изрезан чёткими маленькими пичками. К сожалению здесь на макспарке этого увидеть нельзя, но значения процента, при которых получаются эти пички, образуют интересный ряд - 70, 75, 80, 85, 90, 95 и 98. Все пички кроме последнего образуются при процентах строго кратных пяти ! Вопрос о природе этих пичков обсуждается уже давно. Дело в том, что видны они не только на президентских выборах 2008-го, а вообще на ВСЕХ выборах, проводившихся в России. Предлагались различные гипотезы. И об ошибках округления на УИКах с малым числом избирателей. И о неслучайных результатах арифметических операций со случайными числами, и многое другое. Но мне трудно всё это себе представить. А вот тупого местного чинушу, гоняющего бедных училок из УИКов, чтобы вывели ему красивую цифру за Главного Кандидата(или партию) - легко. Как видите, статистика видит даже это...
В целом вид картинок этих выборов позволяет заподозрить масштабные и массовые фальсификации. В то же время говорить, что выборы сфальсифицированы ТОТАЛЬНО, тоже нельзя. Посмотрите внимательно на картинку Медведева. Наибольшее число УИКов приходится на те, где он набрал скромные 63%, а не 146, как можно было ожидать. А есть и УИКи(к сожалению в картинке на макспарке этого не видно), где Медведев набрал и менее 20 ! Пички же на его картинке говорят о том, что все фальсификации делаются исключительно на местах.
Без какого либо спущенного сверху общего плана. Ведь если бы враньё было централизованным, мы бы видели на картинке предпочтения заказчиков этого вранья. Вместо этого мы видим разнобой. Кто-то из махинаторов считает что сможет выслужиться обеспечив жалкие 70%. А кто-то не мелочится и выдаёт сразу 95 (98 скорее всего просто результат краевого эффекта).
Следующую серию картинок мы нарисуем так. Посчитаем общее число голосов, полученных кандидатом на УИКах с определённой явкой. По горизонтальной оси отложим явку. А по вертикальной - сумму голосов.
Обратите внимание, насколько похожи друг на друга картинки Богданова, Жириновского и Зюганова ! Настолько, что их трудно различить на глаз. Приходится специально приглядываться к мелким деталям. Тем не менее разница в масштабах между ними более 10 раз ! У Богданова в максимуме 30 тысяч голосов, у Жириновского 200, у Зюганова 400. И такое потрясающее сходство... Левые склоны этих картинок похожи на идеальные колокола. Правые склоны искажены. Они сильно растянуты вправо и изрезаны пичками. Но сильно растянута вправо и изрезана пичками и сама явка (см. первую серию картинок). Поэтому в целом про эти картинки можно сказать, что они полностью соответствуют нашим ожиданиям, исходящим из представления о выборах, как о случайном процессе.
Картинка Медведева снова резко отличается от всех остальных. Однако внимательно к ней приглядевшись, видим, что в начале явно пытается нарисоваться что-то очень похожее на то, что мы видим у других кандидатов ! И даже совершенно чётки локальный максимум имеется при точно тех же 63% явки, что и у остальных ! Но начиная с явки 65%, происходит что-то не то...
Примем следующую гипотезу. Голосование за Медведева складывается из двух частей. Нормальной и аномальной. Причём нормальная часть в зависимости от явки ведёт себя точно так же, как для остальных кандидатов, отличаясь от них только масштабом. А аномальная представляет собой исключительно вбросы, карусели, голосования бюджетников и студентов и т.п. Построим суммарную картинку, трёх остальных кандидатов. Это даст нам усреднённую картину нормального голосования. Сравним её значение в максимуме (явка 63%) со значением картинки при той же явке для Медведева. Это даст нам разницу в масштабах. Построим кривую точно такую же как наша суммарная, но с масштабом под Медведева. Это и будет нашей оценочной кривой нормального голосования за него. Разница между нашей оценочной и реальной кривой, это и есть фальсификации. Для наглядности построим все три кривых на одном графике
Видно, что при умеренных явках наша оценка почти идеально совпадает с реальными данными. А значит наша гипотеза блестяще подтверждается !
Теперь у нас есть всё, чтобы посчитать количество вбросов на этих выборах и получить их истинные итоги. Для этого просто просуммируем кривую вбросов по всем значением явки и вычтем полученную сумму вбросов из итоговой явки и голосов за Медведева. Получается следующий результат:
Официальные результаты:
Явка 69.81%
Богданов Андрей Владимирович 1.30%
Жириновский Владимир Вольфович 9.35%
Зюганов Геннадий Андреевич 17.72%
Медведев Дмитрий Анатольевич 70.28%
Реальные результаты:
Явка 57.27%
Богданов Андрей Владимирович 1.58%
Жириновский Владимир Вольфович 11.40%
Зюганов Геннадий Андреевич 21.60%
Медведев Дмитрий Анатольевич 63.76%
Вбросы: 13446081
Как видите, нет ничего тайного, что рано или поздно не стало бы явным. Причём в наш компьютерный век делается это весьма простыми и доступными средствами. Помнится Зюганов что-то говорил о 600 тысячах голосов, вброшенных за Ельцина в 96-м. Либо он сильно поскромничал, либо с тех пор ребята вошли во вкус. А 13 с половиной миллионов не хотите ! 12.5% ВСЕГО (!!!) списочного состава избирателей !
Важное замечание. Оценка результата Медведева здесь на самом деле завышена. Вспомните картинки первой серии, серьёзно намекающие на то, что голоса у Зюганова и Жириновского отбирались. К сожалению я не знаю как это оценить, не в водя достаточно спорных, а главное никак не проверяемых предположений. Например о строгой гауссовости соответствующих кривых. Однако следует помнить, что реальный результат Медведева ещё ниже. И возможно значительно.
На этом пожалуй всё. Продолжение следует как только на сайте избиркома появятся данные по выборам 18 марта. Тогда же выложу в открытый доступ исходники всех своих программ, чтобы убедиться в полученных результатов смог каждый.
Внимание ! По многочисленным просьбам трудящихся выложил архив. Там базы данных за 2004, 2008 и 2012-й годы, сами рассчеты и инструкция, как ставить и запускать необходимый софт. Это предварительная версия, без загрузчика. Окончательную выложу уже после выборов. Скорее всего на гитхабе. Взять архив можно здесь - https://yadi.sk/d/lBaZvOul3TPDKH
Комментарии
Там целый блог посвящён фактически только этому. Сергей конечно мужик хороший, но к сожалению он просто публикует картинки с минимальными пояснениями. Не говоря уж о том чтобы поделиться исходниками. Моя методика несколько отличается от его, но я готов подробно объяснять всё что я делаю. А после выборов поделюсь исходниками своих программ со всеми желающими. По ряду причин сейчас они бесполезны.
==================================
Причина всего одна - не имея результата выборов невозможно написать исходник, дающий заданный результат анализа выборов.
Комментарий удален модератором
*******************************************
По сравнению с человеком, компьютерная программа-парсер:
1)быстро обойдёт тысячи веб-страниц;
2)аккуратно отделит техническую информацию от «человеческой»;
3)безошибочно отберёт нужное и отбросит лишнее;
4)эффективно упакует конечные данные в необходимом виде.
Вся загвоздка в пункте 3))))
И ещё. Сейчас собираюсь выложить базы данных и расчёты. Если Вы найдёте в них ошибку, буду Вам очень признателен. Со всем прочим - извольте в пешее эротическое.
И да, при блокировке Роскомнадзором так и высвечивается: доступ к ресурсу заблокирован по решению и т.п.
А здесь просто:"соединение сброшено". Хороший файрволл)))
Кстати, Вы разобрались, что такое "Рица"?
Или, несменяемый уже в 2012-м не нарушил Конституцию РФ, идя на незаконный срок президентства?
"Итак выборы. Как и многое, да по сути почти всё, в нашей жизни, это штука во многом случайная, статистическая."
Так вот, второе предложение - это в корне неверная установка, на основании которой делаются остальные выводы. Ну, а последний график и предшествующие ему выкладки - это вообще азы подгонки результата под теорию.
Web Scraping with Python: Collecting Data from the Modern Web
picГод: 2015
Автор: Ryan Mitchell
Жанр: Программирование
Издательство: O'Reilly Media
ISBN: 978-1491910290
Язык: Английский
Формат: PDF/EPUB/AZW3
Качество: Изначально компьютерное (eBook) (converted)
Интерактивное оглавление: Да
Количество страниц: 256
Вот вы и троллите.
Если ява с питоном, то разберусь. Очень интересно посмотреть как вы антикапчу делаете.
Успехов!
Удачи.
Дети перехватили инициативу, вот и успокоился.
Кстати, тоже перевариваю сейчас корону вместе с женой. Состояние интересное, как будто ватой голову набили. Резкие, короткие перемены в разных частях тела. Но вроде восстанавливаюсь, надеюсь пронесет. Помогает давнишнее увлечение экстремальными водными процедурами. А жена подсела на таблетки, похоже не меняют они ничего, но для самоуспокоения подойдет.
Несколько подходов до минуты каждый - оптимальный режим. Ну и домашний душ - 7 минут, это с утра.
А за рекомендации спасибо, хочу взять новый, но пока не определился. Информация ценная, буду изучать. Особенно интересует CUDA, Trilinos, Xyce...
https://www.youtube.com/watch?v=3FHQa4fFORo
Я тяжело, неизлечимо и пожизненно болен Небом. В прошлой жизни был командиром немецкого Ю-87. Был сбит под Новороссийском в 1943-м и заживо сгорел в воздухе. В нынешней математик, электронщик и программист. В следующей, хочу стать Душой искусственного интеллекта какого-нибудь серьёзного Корабля. Но поскольку в искусственный интеллект не верю от слова совсем... Ну сами понимаете... За жизнь мою многогрешную, придётся опять воплощаться в России... :)))
В 2012 тоже было огромное количество каруселей бюджетников за Путина
Я понимаю, что математика царица доказательств. Но не могу себе представить, как можно произвести вброс бюллетеней в таком огромном количестве.???
Предположим, что бюллетени заготовлены заранее. Где их хранить до момента вброса?
К моменту вброса надо обеспечить, чтобы была обеспечена явка избирателей в списках выданных бюллетеней. На это надо время и фактически круговая порука всех членов участковой комиссии.
Сделать списки до момента закрытия участков, чревато вероятностью прокола. Вдруг какой нибудь избиратель заявится перед этим и обнаружит, что ему уже выдали бюллетень?
Провал работы участка и скандала не избежать.
Следовательно, все вбросы делаются либо после Закрытия участков, либо ....?
Давайте Петух Орлович договоримся так. Архив лежит здесь https://yadi.sk/d/lBaZvOul3TPDKH . Там базы данных за 2004, 2008 и 2012-й годы, сами расчеты и инструкция как ставить необходимый софт. Если Вы умеете работать с базами данных и писать скрипты на питоне под jupyter, проверить всё у Вас займёт не более получаса. Найдёте у меня ошибку, буду Вам очень признателен. Если нет, значит дилетант здесь безусловно присутствует, но это явно не я.
Ещё пример, гораздо более практический. Возьмем 1000 человек, родившихся ровно 80 лет назад. Каждому присвоим тяжесть заболевания от 0(человек абсолютно здоров) до 100% (человек мертв). Построим гистограмму. По горизонтали тяжесть заболевания в процентах, по вертикали число людей с такой тяжестью. Вопрос, как ведёт себя такой график, приближаясь к 100% ? А как он поведёт себя для людей в возрасте не 80, а 100 лет ? А 200 ?
Соответственно, деление/нормирование на этом участке стремится к бесконнечности.
Еслия правильно понял Вашу модель, то вызывает сомнение следующее- аномально высокий процент проголосовавших за одного кандидата на участках с высокой явкой?
("Посчитаем общее число голосов, полученных кандидатом на УИКах с определённой (высокой) явкой. По горизонтальной оси отложим явку. А по вертикальной - сумму голосов.")
Ну так этому тоже легко найти объяснение- представьте нормальных людей и сектантов....сектанты придут все и проголосуют за своего бога....второй вариант- живут общиной замкнутой....взаимное психологическое, административное и т.д.влияние...
ИМХО, тут чтобы построить корректную стат модель не хватает массы данных (факторов)...что не исключает Вашего предположения про вбросы
По поводу честности голосования....так тут все компании выборные были, мягко говоря, не честными....не говоря уж о последней, которую даже выборной компанией трудно назвать....
Хорошо бы еще УИКи по территориям сделать...думаю, это многое прояснит
Удачи Вам
Комментарий удален модератором
Что касается наукообразного бреда и заготовок для идиотов. Изложенная мной логика доступна пятикласснику. Базы данных и расчеты выложены и доступны для свободного скачивания. Пожалуйста найдите в моих рассуждениях или вычислениях ошибку и я с удовольствием её признаю. Пока же я считаю что президентские выборы 2008-го масштабно сфальсифицированными. Точно так же как и 2004-го и 2012-го. И буду так считать, пока Вы не объясните мне приемлемым образом все их статистические аномалии.
Комментарий удален модератором
Ну и насчёт подрывной деятельности. Скажите, какая деятельность более подрывная ? Эта моя статья, опубликованная на макспарке ? Или постоянная фальсификация любых выборов за последние более чем 20 лет, с единственной целью сохранения Системы, убивающей Россию ? И пожалуйста поверьте, я не меньший патриот чем Вы. Умный человек по-моему вообще не может не быть патриотом. Хотя бы из понимания РЕАЛЬНЫХ раскладов и примитивного чувства сохранения себя и своего Рода.
Комментарий удален модератором
По поводу нормальных распределений. Вы очевидно невнимательно читали статью. Ключевой момент у меня здесь это очень сильное сходство между кривыми явка-голоса для трёх кандидатов аутсайдеров. И великолепное совпадение модельной кривой для Медведева с его реальными данными, при явках меньше 65%, что прекрасно видно на последнем графике. Согласитесь, никакой подгонкой получить этого нельзя. А значит и статистическая модель свободного, не искаженного админресурсом голосования, для всех четырёх кандидатов, практически одинакова. Именно по ней я и вычисляю итоги выборов и величину вбросов. Где Вы видели, что я где-то полагаю это нормальным распределением ? Нет этого. Нигде. Наоборот, я отказываюсь оценивать кражи голосов у Жириновского и Зюганова именно потому, что не знаю как это сделать не предполагая нормальности их распределений.
Комментарий удален модератором
Я чуть со стула не упал.
Вы в курсе, что ВПП вначале примерно одинаковый с Ю.Кореей - сейчас в 40 (сорок) раз ниже?
Не позорились бы...
Комментарий удален модератором
Комментарий удален модератором
Комментарий удален модератором
Комментарий удален модератором
Вы как я понимаю, из всей инфы выбираете только задолизательскую - ну нравится Вам чем-то пухляш.
Есть серьезный источник - экономическая статистика.
Что он там едят траву или гуано - мне все равно. Я не знаю.
А то что Вам очень хочется вылизать чучхистов - вполне очевидно.
Я понимаю, что математика царица доказательств. Но не могу себе представить, как можно произвести вброс бюллетеней в таком огромном количестве.???
Предположим, что бюллетени заготовлены заранее. Где их хранить до момента вброса?
К моменту вброса надо обеспечить, чтобы была обеспечена явка избирателей в списках выданных бюллетеней. На это надо время и фактически круговая порука всех членов участковой комиссии.
Сделать списки до момента закрытия участков, чревато вероятностью прокола. Вдруг какой нибудь избиратель заявится перед этим и обнаружит, что ему уже выдали бюллетень?
Провал работы участка и скандала не избежать.
Следовательно, все вбросы делаются либо после Закрытия участков, либо ....?
----------------------
В Германии назвали Путина хозяином мировой политической арены https://vz.ru/news/2018/5/19/923536.html
Почему мировые лидеры побежали к Владимиру Путину https://newsland.com/community/5652/content/pochemu-mirovye-lidery-pobezhali-k-vladimiru-putinu-video/6350068
гарантирован на все 146%.
-------------
2011 год - это не данные от ЦИК и от Чурова, который возмутился тем, что ЦИК-у приписали эти цифры, а это просто... косяк от канала "Вести 24"
.
https://www.youtube.com/watch?v=DXctQSX-Np8
Если поздно, то уже никогда.
Выборы – игра в напёрстки для лохов.
.
Т.ч. ответственность по этой части лежит только на Путине.
гораздо умнее поступили меркелевцы в германиях - оппозиции просто пощитали 0,0% !
учите матчасть буржуинских коньсцитутсий !
Могу лишь добавить , что подозрительные зубцы на приведённых вами графиках сегодня получили название "Пила Чурова" -- это такой посильный вклад путиноидов в мировую математическую науку.
Логики и смысла в них НОЛЬ.
Под нужные автору результаты можно подогнать и "смастрячить" любой алгоритм.
Реальных данных у автора естественно нет.
Так что это все "вилами на воде....."
А смысл объяснять дилетантам?
С чего Вы решили что никто тут ничего не смыслит?
Здесь, на макспарке, невсланде тусуются в основном неучи, тупицы и неудачники.
Я например встретил здесь за все время человек 10 с которыми можно что то обсудить и поделится мыслями.
Остальные, по 5 клонов на одного, которые отрабатывают и зарабатывают неся ахинею.
Или пацанва с гопническим мышлением.
Нет, ребята. Если хочется доказать фальсификации, то надо послать на каждый избирательный участок своего наблюдателя (да думаю не одного). Они смогут (если смогут) пересчитать проголосовавших. На выходе опросить пожелавших ответить. Тогда может быть сложится картинка, пригодная для обсуждения. А так... Красивые слова, умные... Только толку то...
В машкоде программы, тем более такие прикладные - никто давно уже не пишет. Да и ассемблером давно не балуются без настоятельной необходимости увеличить скорость расчетов.
А в данном случает в расчетах вообще ничего сложного нет - полный примитив - построение гистограмм.
Трудность - только с добыванием исходных данных в виде, удобном для дальнейшей обработки. А там - хоть на бейсике. Вопрос не горит.
Как говорил мой шеф-учитель:
- Гауссовская кривая очень часто встречается в обыденной жизни, особенно в курсовых проектах студентов, кандидатских и докторских диссертациях. Нет там Гаусса, даже невооруженным взглядом.!
2. Говорить о достоверности результатов можно ТОЛЬКО при заданном доверительном интервале и доверительной вероятности.
В противном-это наглая ложь или статистика, а не статистический анализ.
3. Пики в кривой однозначно определяются интервалами по % по оси абсцесс.Выборка интервала, например в 0,01% (что сделано в расчётах, т.к. данные приведены до второго знака после запятой, например-Богданов Андрей Владимирович 1.30%), становится не представительной, т.е. не отражает статистические характеристики случайного процесса:мат. ожидания и дисперсии.
Сделайте разбиение в 0,1% и эти пики исчезнут. А коли нет, то 0,2%, 0,3 и т.д. А если серьёзно, то нужно оценить сначала минимальную выборку при требуемой доверительной вероятности и доверительном интервалом. А потом выбирать шаг разбиение по % при построении гистограмм.
1) Пожалуйста, укажите мне место, где я говорю о гауссовской кривой. Кроме самого начала, где я о ней упоминаю скорее как о некоем идеальном образе. Ключевой момент здесь это очень сильное сходство между кривыми для трех кандидатов аутсайдеров и начальным участком кривой победителя. Что говорит лишь о том, что одна и та же статистическая модель прекрасно работает для всех четырёх кандидатов. И это прекрасно подтверждается. Смотрите последнюю картинку.
2) Абсолютно согласен. Увы, это оценочные расчеты. И был бы Вам очень благодарен, если бы Вы подсказали мне, как всё это получить из имеющихся данных, не вводя спорных и не проверяемых предположений. Типа строгой гауссовости каких-то кривых.
3) Всё верно. Я разбивал на 100 баров (1 процентный пункт) исходя из компромисса между разрешением и удобством вывода на график. Да, можно сделать и с бОльшим разрешением. Однако пики так и останутся в том же процентном интервале. Просто при бОльшем разрешении по нему размажутся.
Имел ввиду, что исчерпывающей характеристикой любого случайного процесса является плотность распределения вероятностей (ПРВ). Если её определить с допустимой доверительной вероятностью по результатам выборки и доверительным интервалом, то далее всё классика статистического анализа.
Мы же предполагаем (это наша гипотеза), какова она может быть и вычисляем мат. ожидание (максимум кривой) и дисперсию (расползание этой кривой) по оси абсцисс.
НО при вычислении М и D должна участвовать ПРВ истинная, а мы вычисляем всегда средние значение и средний квадрат отклонения по формулам для Гауссовского закона.
Для Рэлея они другие.
Все вычисления идут для Нормального закона распределения.
Потому как оценивать доверительные интервалы не зная функции распределения нельзя.
:-)
И скажу по секрету - матожидание и дисперсия - это параметры, смысл которых ясен для нормального распределения. И применимость их к адекватному описанию распределения типа медведевского - сомнительна.
Секрет Ваш ложен! М и D-есть параметры ПРВ СВ и являются статистическими характеристиками СП, как и ковариационная матрица.
Кстати, нормированная площадь под всеми ПРВ должна быть равна единице, т.к. это есть вероятность всех событий. В ваших графиках этого нет, проверьте, у Вас вероятность получается больше единицы!..%-)))))))
Назови выборку из СП презентативной или представительным-суть не меняется.
На эту тему давно есть критерии оценки нормальности распределения.
Но и тут не все так просто.
Интересно было бы оценить на соответствие нормальности "ядро" ПРВ, и отдельно влияние "хвостов", отличие ПРВ от нормального в ядре, на хвостах и в целом.
А в общем - в данном случае конечной задачей является оценить не нормальность распределения, не среднее и дисперсию, а сходство и отличие ПРВ для разных кандидатов.
К сожалению, стандартных методов решения таких задач не существует, требуется эвристический творческий подход, который вполне может стать темой диссертации.
При чем тут ковариационные матрицы - аллах ведает. На графиках, как я понимаю, представлены гистограммы а не ПРВ. Чтобы получить ПРВ следует сгладить и пронормировать.
(кстати - это вопрос не ко мне - я не автор статьи, так, мимо проходил).
Мне лично видится такой подход - выделить "ядро" ПРФ для остальных кандидатов, прикинуть зависимости СКО от среднего значения (СЗ), откорректировать по этому параметру, рассчитать "идеальную кривую". рассчитать отклонения ПРФ (беря только "ядра") друг от друга, рассчитать ожидаемое "ядро" ПРФ для Медведева, найти о...
Дали данные и заказали к какому выводу надо прийти!
Вас развели, а по сему Вы ещё большИй ЛОХ!
Сколько будет выплачено Просто Коту, если :
- докажу, что ваши исследования -полный бред=...$
- докажу, что это исследование достойно внимания=....$
Сколько отвесите в граммах?
Ладно, поехали! Замнём для ясности!
И да, торопитесь. Вторая часть будет переписана на julia. Это язык гораздо менее распространённый и более трудный чем python. Просто для второй части мне нужна скорость.
Сколько будет стоить договор с Просто Котом по деньгам и срокам, чтобы профессионально эту базу обработать? Представить всю математику обработки и ПО, соответствующее этой аналитике?
Результаты представлю по указанному адресу Вами, а дальше решайте, что с ними делать!
Публиковать или признать себя неучем!!
%-))))))))
https://www.youtube.com/watch?v=Bkd_-oHP4Co
- Путин-вор,
- россияне быдло,
- Россия говно.
И ЧЕ?
А ничего. Васька слушает, да ест.
А не очередной высер про "лунную аферу" и тому подобное шарлатанство.
Автору - респект.
И если нет ошибки в исходных данных и расчетах, данная статья бесспорно свидетельствует о "химии" на выборах.
Хотя подобные выкладки и не позволяют судить - где конкретно.
Также как напр. плодовитость кавказа на диссертации бесспорно свидетельствует о "химии", но не позволяет сказать где и кто именно. То же и с ЕГЭ.
Но что печально - такие результаты будут конечно же, отвергнуты властями, и никакого резонанса "наверху" кроме отрицания не вызовут.
ПуКин всё равно обдурит народ России в своих очередных 4-х или 5-х "выборах".Такие ваши с ПуКиным дела...
Пламенный привет с Ближнего Востока! Ваш Поэль.