Ложь, наглая ложь и статистика — механизмы обмана

На модерации Отложенный

Люди не дружат с цифрами. Так устроен наш мозг. Вот почему ученые могут сколько угодно приводить статистику по глобальному потеплению, но мы перестаем ей верить, как только на нашей улице холодает. Мы не виноваты: человеческий мозг не приспособлен для работы с цифрами, да и, честно говоря, в повседневной жизни мы вполне можем обойтись без обработки больших чисел. Ведь теория больших чисел не сильно поможет заменить перегоревшую лампочку.

Но есть базовые вещи, которые полезно знать каждому. Они кажутся простыми и очевидными, когда их объясняешь, но спустя несколько дней вы опять можете попасться на ту же самую удочку, поэтому постарайтесь не забыть то, о чем мы сейчас расскажем.

#5. «В среднем», «на самом деле», означает совсем не в среднем

Похоже, что…

Шокирующие цифры: в США средний доход составляет около $70,000. Если вы живете в Америке и зарабатываете меньше, прочитать такое будет ударом по самолюбию. Только что вы были уверены, что вполне прилично зарабатываете, а теперь подумываете найти вторую работу, чтобы получать не меньше, чем вон тот из соседнего дома. В чем его секрет? Они, что, все наркотиками приторговывают?

Проблема в том, что…

Значение широко применяемого термина «в среднем» кардинально отличается от значения математического термина, хотя зачастую их используют как синонимы. Вот почему время от времени мы с удивлением узнаем, наcколько «средний» человек богаче\толще\выше нас.

Когда в повседневной речи мы говорим «средний», то имеем в виду «большинство людей» или «типичный представитель» (например, во фразе «в среднем люди не читают классическую литературу» или «в среднем обычный человек не может себе позволить одеваться как принц»).

Если же слово «средний» употребляется в статистике, результаты шокируют: так, например, 67% населения в США зарабатывают меньше «среднего» уровня. Каким же образом «в среднем» может относиться к большинству людей, когда большинство — не дотягивают до «среднего уровня»?

Мы все помним со школы, как рассчитывается средне арифметическое: берутся все значения диапазона, складываются, и затем полученная сумма делится на количество значений. И все замечательно, когда мы считаем среднее близких по значению величин: среднее между 1, 2, 3, 4 и 5 будет 3 — как раз посередине. Если же в диапазоне есть несколько нетипично высоких значений, считать среднее бессмысленная затея: среднее между 1, 2, 3, 4, 40 и 10 — покажет совершеннейшую ерунду. В этом и кроется проблема статистики по «средним доходам»: из-за нескольких богатых людей цифры искажаются.

Если вы зарабатываете меньше среднего уровня, дело не в том, что у вас плохая работа. Дело в том, что вы живете в одной стране с Билом Гейтсом, Марком Цукербергом и владельцем Кока-Колы (читатель из России может дополнить список миллиардеров — прим.ред) — как бы там его ни звали — мистером Кока или как его там.

Почему это важно?

Это кажется таким очевидным, когда объясняешь, и тем не менее трюк каждый день рождает новые и новые мифы. Например, в одном исследовании говортся, что на 100 американцев приходится 88 единиц оружия, из чего можно сделать вполне обоснованный вывод, что почти все в Америке вооружены. Как вдруг в другом исследовании говорится, что только у 43% семей в доме есть оружие.

Тот же самый эффект: из-за неуемных любителей оружия средняя цифра получилась сильно завышенной… и в процессе оказывается невозможно понять, как же обстоят дела на самом деле. Средние цифры, как правило, только путают картину вместо того, чтобы ее прояснить.

Вот почему наиболее авторитетные источники, которые занимаются вопросами распределения доходов, используют медиану, а не среднее. Медиана — это настоящая середина. Рассчитывается она проще некуда: с каждого конца диапазона вычеркиваются значения, пока вы не доберетесь до середины. Такой метод дает более реалистичную цифру порядка $50 000. Ну вот, мы только что немножко повысили 17% из вас самооценку.

#4. Утверждение «верно на 99%» может быть верным, а может — бессмысленным

Похоже, что…

Вы сидите на кушетке в кабинете врача, и у него для вас плохие новости. Анализы показали, что у вас рак. Вы спрашиваете: «Доктор, вы уверены?» И врач говорит, что тот конкретный анализ, который вам сделали, в 99% случаев дает верные результаты, и только в 1% случаев показывает ложно-положительный результат у совершенно здоровых людей. Вы на 99% обречены. Пора писать завещание и исполнить свою давнюю мечту — прыгнуть с парашютом.

Проблема в том…

Все, что сказал доктор, чистая правда, и все же вероятность того, что вы, и вправду, больны раком составляет 1 к 80.

Погодите, как так? Это невозможно.

Возможно. Это распространенный пример ошибки базовой оценки. Да, если у вас рак, то тест, действительно, дает верные результаты в 99% случаев. Другими словами, у 100 раковых больных тест покажет ошибочный результат всего один раз. Проблема как раз в этой второй цифре: для здоровых людей тест все равно выдает 1% положительных результатов. То есть в процессе диагностики рака, тест дает такое количество ошибочных диагнозов, что положительный результат становится почти бессмысленным. Как это может быть, если он дает ложно-положительный результат только в 1% случаев? Да очень просто: этот 1% в реальности очень большая цифра.

Число больных, скажем, раком поджелудочной железы составляет 1 на 8000. Если тест говорит «у вас рак» в 1% случаев, значит, 80 людям из этих 8000 врач скажет, что они больны, хотя статистически только у одного из них на самом деле рак. То есть для каждого, услышавшего вердикт «у вас рак», вероятность того, что это правда, составляет 1 к 80.В такой ситуации имеет смысл сдать дополнительные анализы, а вот высказывать начальнику все, что накпипело, и отправляться торговать наркотой — вряд ли.

Почему это важно?

Многие технологические новинки обещают впечатляющие результаты, если только проигнорировать базовую оценку. Например, несколько лет назад в США Администрация безопасности на транспорте начала внедрять новую технологию выявления террористов. Они уверяли, что эта технология позволяет определить террориста более, чем в 99% случаев, и только 0,01% невиновных людей могут быть ошибочно квалифицированы как участники Аль-Каиды.

Цифры кажутся невероятными, но также как и в случае с раком, они означают, что огромное количество невиновных людей будут ошибочно объявлены террористами. Например, в 2010 г. примерно 700 миллионов раз кто-то садился в самолет, летевший в Америку. Если их детектор террористов выдавал «всего» 0.01% ошибочных результатов, значит, 70 000 человек выдернули из очереди, обвинили в терроризме, раздели и обыскали. И из этих 70 000 человек по статистике ни один не являлся террористом. Цифра в 0,01% впечатляет ровно до тех пор, пока вы не окажетесь одним из тех, кого случайно обвинят в том, что у него в заднем проходе спрятана маленькая бомба.

#3. Заявление компании/группы/и т. д., что они «самые быстрорастущие» может оказаться совсем не таким радужным

Похоже, что…

Не так давно мы упоминали вирусный ролик, разошедшийся по интернету. Он предупреждал о надвигающейся исламской угрозе. Ведь ислам — «самая быстрорастущая религия в мире». Спасайся, кто может!

Некоторые весьма уважаемые источники вынесли эту новость на первые полосы, а консервативые комментаторы приводили ее в качестве аргумента за то, что западным странам скоро придется одеть своих женщин в паранджу и отправиться паломниками в Мекку, если только мы не образумимся и сейчас же не начнем активно размножаться и бороться с мусульманами.

Проблема в том…

Большинство источников, приводящих статистику про «самую быстрорастущую религию», базируют свои расчеты на процентном соотношении: количество исповедующих данную религию выросло вдвое? Увеличилось на 50%? При таком методе у ислама, действительно, довольно высокие показатели роста: количество мусульман ежегодно увеличивается на 2.13%. Но, как минимум, две религии идут в списке выше. Угадайте, какие? Индуизм? Буддизм? Не угадали: зороастризм и бахаизм. Они прибавляют, соответственно, по 2.65% и 2.28% сторонников ежегодно. Забудьте о хиджабах и тюрбанах — скорее всего, вам предстоит привыкнуть жить по 19-ти месячному календарю и поклоняться Ахуре Мазде.

Думаю, вы уже догадались, что полагаться на процент прироста последователей религии не стоит. Представьте, что ваш сумасшедший дядюшка вместе с парочкой- другой приятелей решили поклоняться копченому бекону.

Если они уговорят присоединиться к ним еще двух членов местного загородного клуба, это будет означать, что Церковь Беконизма выросла аж на 40%.

Если же зайти с другой стороны и оценить рост религии по абсолютному количеству новых приверженцев в год, тогда титул «самой быстрорастущей» получит та религия, в которую придут, обратятся или внутри которой родится наибольше количество людей. В этом случае титул получит, скорее всего, Церковь Пятидесятников. Этот подход показывает уязвимость такого показателя, как «рост в процентном соотношении» — он имеет смысл только, если вы умеете предсказывать будущее. Если Беконизм продолжить расти на 40% в день, через два месяца число его последователей составит 5.7 миллиарда! Или их так и останется семеро, пока все они не умрут от инфаркта в 43 года.

Почему это важно?

Предвижу, как мне возразят: «тот факт, что они растут быстрее всех, тем не менее означает, что если нынешний тренд сохранится, они рано или поздно станут самыми многочисленными!» Да, так и будет. Если текущий тренд сохранится. Но текущие тренды далеко не всегда сохраняются, иначе алармистам незачем было бы волноваться: единственная причина, которая заставляет их шуметь — это изменение того или иного тренда.

Подводя итоги, если вы услышали, что какая-то компания стала «самой быстрорастущей», прежде чем бросаться в нее инвестировать, поинтересуйтесь, не означает ли это в реальности, что они увеличили свой штат с трех до шести человек.

И если кто-то использует аргумент про «самый быстрый рост» для того, чтобы заставить вас бояться кого то, не лишним будет задуматься, не стоит ли их бояться по другим причинам.

#2. «Эпидемия» вполне может оказаться случайным стечением обстоятельств

Похоже, что…

Исследования показывают, что те, кто живут рядом с ЛЭП (Линия электропередачи), чаще болеют раком и другими опасными заболеваниями! Значит, электричество тихо убивает вас изнутри! Как хорошо, что в эту самую минуту вы не смотрите в светящийся экран какого-нибудь устройства, работающего от электричества.

Проблема в том, что…

Теория о том, что «ЛЭП вызывают рак» появилась в результате реального исследования, которое, на самом деле, вызвало панику несколько лет назад. Авторы посмотрели на карту, очертили области вокруг ЛЭП и посмотрели, чем болеют люди, живущие внутри этих областей. Разумеется, оказалось, что у многих просто букет разных неприятных заболеваний.

Однако они стали жертвами так называемой «ошибки меткого стрелка» или «ошибки группировки» — когда человек видит в случайных данных ложные закономерности. Название этой ошибки происходит якобы от ковбоя, который сначала беспорядочно стрелял в стену амбара, а потом рисовал мишень тем, куда приходилось наибольшее количество дырок от пуль, и хвастался всем, какой он меткий стрелок.

Очевидно, что если взять достаточно большую выборку населения, в ней всегда найдутся случайные закономерности, особенно, когда вы ничем не ограничены в поиске. Так, например, авторы упомянутого исследования вполне могли бы обнаружить, что люди, живущие рядом с ЛЭП, на 5% чаще называют сыновей Стивом или что они на 3% чаще выбирают красные велосипеды.

Когда речь идет о незначительных различиях, можно отыскать самые невероятные связи. Итак, они обнаружили, что в некоторых районах дети до четырех раз чаще заболевают лейкемией (о Боже, ЛЭП убивает наших детей!!!).

Правда, они обошли вниманием тот факт, что в других районах дети заболевали раком крови реже среднего уровня (о Боже, ЛЭП обладает сверхъестественными целебными свойствами!!!).В реальности же цифры просто уравновешивали друг друга.

И если вы только что подумали: «Да, но если дети заболевали в четыре раза чаще, значит, что-то такое там было», значит, вы уже забыли, минимум, два пункта из этой статьи (подсказка: лейкемия — редкое заболевание, за четырехкратным ростом заболеваемости стоит не так уж много реальных больных).

Почему это важно?

Помните жуткую историю, как в Майами один сумасшедший вцепился зубами в лицо жертве и искусал человека? После этой истории почти каждый день всплывали новые факты точно таких же нападений. Пока наконец даже скептики не решили: «Еще один сумасшедший укусил кого-то в метро? Между этими случаями должна быть какая-то связь».

И она была: когда люди дерутся, они всегда пытаются друг друга укусить. Просто до случая в Майами такие происшествия не попадали в новости. Единственное изменение — теперь каждый укус попадал на первые полосы газет. Люди начали искать закономерность — и вот вам, пожалуйста, она нашлась. А потом она всем надоела, хотя только что кто-тогде-то в драке кого-то укусил.

На протяжении многих веков эта ошибка заставляла нас выдумывать совершенно невероятные эпидемии. Именно она считается одной из причин «охоты на ведьм» в средние века (да и в наше время тоже): если неожиданно в одном месте заболевало много людей и по соседству жила странная женщина, значит, это она наслала недуг с помощью дьявольского колдовства.

Справедливости ради, отметим, что иногда тренд, на самом деле, существует. Только вызван он бывает совершенно другими причинами. Что подводит нас к самому известному заблуждению…

#1. После не значит вследствие

Похоже, что…

СМИ обожают публиковать данные о том, что грозит убить нас именно сегодня согласно последним научным исследованиям. Например, в рамках одного исследования о влиянии телевидения на наше здоровье, ученые с удивлением пришли к выводу, что смотреть телевизор также вредно, как курить. Они обнаружили, что каждые полчаса, проведенные перед телевизором, отнимают у человеком, старше 25 лет11 минут жизни. Но как же тут остановиться, когда идут целых шесть кулинарных шоу про выпечку?!

А, может быть, вы встречали тех, кто все еще верит, что прививки вызывают аутизм у детей? В подтверждение своей правоты они приводят убедительные графики, на которых видно, что да, действительно, с ростом количества прививок, увеличивается и количество детей с аутизмом. А с графиками не поспоришь…

Проблема в том, что…

Если вы можете рассказать, как устроен телевизор, не употребляя слово «волшебство», то вы знаете, что телевизор — это всего лишь ящик с проводами и лампочками. Трудно вообразить, каким образом банальный набор электротехнических деталей в другом углу комнаты может высасывать из вас жизненные соки. Здесь и кроется проблема: в статье говорится о причинно-следственной зависимости, а, на самом деле, здесь зависимость временная.

Разница заключается в том, что до тех пор, пока вы точно не узнаете, каким именно образом телевизор вас убивает, вам известно лишь, что телевидение и смерть каким-то образом связаны. Может быть, многочасовое сидение перед телевизором и преждевременная смерть являются симптомами чего-то еще?

Кстати, скорее всего, это верная гипотеза: люди, которые не любят физические упражнения, выбирают себе хобби, не требующее лишних движений (например, смотреть телевизор). И убивает их недостаточная физическая активность. Другими словами, читать книгу намного опасней для жизни, чем смотреть телевизор, крутя педали на велотренажере.

Еще одним известным примером является миф, будто бы дети, которые завтракают, лучше учатся в школе. Статистика, действительно, показывала зависимость между наличием завтрака и более высокой успеваемостью, поэтому родители начали силком запихивать в детей по утрам хлопья, надеясь таким образом, обеспечить им поступление в колледж.

Однако когда это явление изучили более подробно, обнаружилось, что акт поедания завтрака никак не влияет на умственные способности ребенка. Просто те дети, у которых в жизни происходит что то, от чего они теряют аппетит по утрам, как правило, и в школе плохо учатся.

Почему это важно?

Это было бы неважно, если бы единственным следствием являлся рост продаж хлопьев во время учебного года. Но дело становится куда серьезней, когда таким же образом пытаются выявить причины социальных проблем.

Можно ведь решить, что вакцины вызывают аутизм, хотя рост количества детей с аутизмом объясняется не количеством прививок, а тем, что врачи научились лучше диагностировать это заболевание. Наглядно иллюстрирует это график, наскоро сделанный оппонентами анти-прививочников.

Настоящая причина, вызывающая рост заболевания аутизмом?

Источники: Ассоциация торговли экологически чистой продукцией; Отраслевой отчет по производству экологически чистой продукции, Департамент образования США, Отдел специальных образовательных программ, и т. д.

Натаниэль Коуп, Джеймс Спеддинг

19 марта 2013 г.