Статистический анализ - это скучно?

   Статистический анализ (в дальнейшем СА). Этот термин для неспециалиста уже сам по себе навевает скуку, настраивает на некую нудную скрупулезность, обилие цифр и подсчетов, однообразие действий и т.д. и т.п. Но для нынешней жизни - это важнейший, необходимейший для практики раздел математики. Давая ему определение по возможности наиболее простое, СА - это применение математической теории вероятности к результатам любого исследования, позволяющее выделить закономерные данные и отсеять случайные.

   СА применим к множеству видов человеческой деятельности, например к литературе. И эта "скучнейшая штука" иногда даёт интересные, удивительные и любопытные данные даже для человека, далёкого от всякого рода расчётов. Например сегодня с помощью СА и применения ЭВМ возможно относительно быстрое прояснение вопроса спорного авторства некоторых текстов, на что ранее уходили годы споров. Именно так была поставлена точка в единственном авторе "Илиады" (были гипотезы, что их несколько).

   Или возьмём например установление каких-то характерных особенностей великих поэтов, скажем А.С.Пушкина.

Рассмотрим СА частоты повторяемости отдельных слов, "излюбленных" для А.С.Пушкина. Почти тридцать лет ушло на составление такого "частотного" словаря нашего великого поэта. Но зато исследователи получили богатейший материал для углублённого изучения его творчества. Любопытнейшие вещи можно узнать даже при самом поверхностном и беглом просмотре этого словаря. Точно подсчитано, что во всех своих произведениях Пушкин использовал около 21 000 различных слов, а всего его рукою написано 544 777 слов. Чаще всего встречается союз "и" - 21026 раз. Всего по одному разу употребил великий поэт во всех своих творениях слова: благоуханный, безграничный, бравый, беспокойно, бедно, беспощадно, заманчиво, горделиво (тогда как у некоторых заурядных поэтов и прозаиков эти слова так и пестрят). "Частотный словарь" раскрывает даже какие-то черты характера Пушкина. Разве не примечательно, что слово "радость" с различными производными от него встречается 601 раз, а "печаль" - 392 раза?...

Итак, как видим, статистический анализ не такая уж скучная штука.