Как понять: где корреляция, а где причинно-следственная связь?

На модерации Отложенный

В статье «Наука о данных: как отделить кажущееся от реальности»  приводится пример исследования влияния бега на здоровье человека методами data science.

Исследование было связано с тем, что в 2012 году ученые заявили, что практически любой бег интенсивнее предельно медленной трусцы на самом деле вреден для здоровья. Это подтверждали цифры, статистика. И поэтому было решено тщательнее проанализировать данные методами машинного обучения и data science.

И далее в статье идет описание этой «исследовательской работы», ознакомившись с которой я поняла, что наука о данных вряд ли оправдает те большие надежды, которые на неё возлагают.

Например, при исследовании выяснилось, что «бегуны реже курят и меньше пьют, чем люди того же пола и возраста в целом, да и масса тела у них ниже, чем у других».

«Возник вопрос: нет ли здесь смешения корреляции с причинно-следственной связью? То есть не может ли быть так, что люди бегают потому, что их сердце и сосуды здоровее, чем у тех, кто не бегает? А те бы и рады бегать, но не могут?»

Для ответа на этот вопрос данные были разбиты на группы и исследованы другими методами, кому это интересно, можете почитать сами. В итоге аналитики пришли к выводу, что бег полезен для здоровья, т.к. продлевает жизнь.

Неужели кто-то согласен с тем, что здесь обнаружена причинно-следственная связь? Неужели эти выводы можно считать научными?!

И что самое страшное, сегодня многие важнейшие экономические, политические решения принимаются на основе таких вот «аналитических исследований»! А в скором будущем такая ситуация будет и в ряде других областей – от медицины до атомной энергетики!

Считается, что человек может ошибиться, а dаta scientist даёт объективную оценку, но ведь он тоже человек! И где гарантия, что сделанные им выводы отражают реальную закономерность?

«Корреляция не означает причинно-следственной связи», - это знает любой аналитик. Но как отличить корреляцию от причинно-следственной связи?

Для начала надо понять: какую проблему пытается решить тот, кто задает вопрос?

В данном случае вопрос звучит так: «Влияет ли бег на продолжительность жизни?» Неужели вы думаете, что его интересует бег? Его интересует ЖИЗНЬ, и его пугает смерть. В этом суть вопроса! Вот с этой проблемой и следует разбираться в первую очередь!

А все эти вычисления вероятностей того, на сколько месяцев больше я проживу, если буду бегать по 4 часа в неделю – не решают проблему. И все подобные исследования о вреде или пользе хлеба, мяса, вакцины от коронавируса и т.д. - они не позволяют решить саму проблему, а лишь помогают вам утвердиться в той или иной гипотезе, вычислить вероятность.

Если мы хотим обнаружить не просто корреляцию, а причинно-следственную связь, мы в первую очередь должны понять, какая причина привела к постановке самого вопроса, к возникновению самой проблемы.

Надо уметь слышать самого вопрошающего, понимать суть его проблемы. В противном случае, вы дадите какой-нибудь ответ на поставленный формально вопрос, но он будет совершенно бесполезен. А нам нужно принять решение и получить результат, который снимет проблему. Вот тогда это будет реальная причинно-следственная связь, подтвержденная на практике.

А еще лучше, станьте сами для себя dаta scientist-ом! Научитесь понимать, чего вы на самом деле хотите, ставить правильные вопросы, получать точные ответы и принимать верные решения.

Допустим, вы узнали, что тот, кто бегал, прожил 100 лет, а кто не бегал – 98. Вы готовы ради этой 2-летней отсрочки бегать по 4 часа в неделю всю оставшуюся жизнь? Неужели на смертном одре вам будет греть душу мысль, что вы прожили на несколько лет дольше, чем ваш одноклассник? Разве смысл жизни в том, чтобы умереть как можно позже?

Вы хотите торговаться со смертью или исследовать, что есть жизнь, познавать её каждый миг, совершенствовать мир и развивать сознание? Ответьте себе честно на этот вопрос. И когда вы выберете Жизнь и начнете проживать её полноценно, со смыслом, вопрос о смерти будет снят.

Проблема в том, что мы не умеем слышать ни себя, ни других. Мы слышим слова и цепляемся за них, не утруждая себя вникнуть, что стоит за ними – какие чувства, какая боль, какая мечта. Мы спешим дать формальный ответ, даже не поняв суть вопроса.

Когда человек спрашивает: «Есть ли Бог?», что стоит за этим вопросом? Какую проблему он хочет этим решить? Разве поможет ему в этом простой ответ «да», или «нет»? Разве нужны ему споры о терминах, богословские диспуты, логические доказательства? Когда ему просто нужно ощутить смысл своей жизни, почувствовать единство с миром, уверенность в незыблемости бытия и торжестве истины. И если от вас это не исходит, то как он вам поверит?

Вы скажете, что я отошла от темы, но на самом деле суть статьи именно в этом. Вы не установите причинно-следственные связи в природе, если будете анализировать только цифровые данные, статистику, чужие действия, не осознавая СВОЕЙ ответственности за происходящее, своей роли в мире.

Когда вы смотрите на мир отстраненно, как внешний наблюдатель, вы анализируете, оцениваете, вычисляете вероятности, но обнуляете сам смысл бытия

Но если, наблюдая мир, вы чувствуете себя участником общего развития, эволюции жизни, ваше сознание становится созидающим, синтезирующим, творческим. Вы становитесь одной из причин бытия, одним из его со-творцов, одним из центров самоорганизации жизни. Чем больше в мире осознанных, тем больше в нем света и гармонии.

Становясь одним из осознанных, занимаясь САМОразвитием и самоорганизацией, мы увеличиваем общий уровень самоорганизации в системе.

Некоторые скажут: «Один я ничего не изменю, пусть сначала все станут осознанными», но это ошибка. Когда я становлюсь осознанным, не только на одного неосознанного меньше, но я начинаю видеть всё самое светлое и разумное в других, я лучше начинаю всех понимать. Свет освещает всё вокруг, делает очевидным смысл. Но когда я остаюсь неосознанным, то и в других я вижу одну лишь неосознанность.

Недавно я прочла статью о том, что английский физик Мелвин Вопсон допускает, что информация вполне может быть той самой темной материей, которую никак не удается обнаружить космологам. Человечество использует всё больше физической материи, чтобы удовлетворить наши запросы в вычислительной мощности и информации. Фактически мы преобразуем материю в информацию, количество которой растет в геометрической прогрессии.

Его гипотеза, конечно, весьма необычна, и во многом с ним можно не согласиться, но если под информацией понимать содержимое нашего сознания и систему мировоззрения, то действительно нет ничего удивительного в том, что 90% сознания остаются для нас покрыты мраком. И возможно, добившись полной осознанности, мы будем совсем иначе воспринимать мир и взаимодействовать с ним, в том числе и на информационном уровне.