Корреляция не подразумевает причинно-следственную связь: 5 реальных примеров


Фраза « корреляция не подразумевает причинно -следственной связи» часто используется в статистике, чтобы указать, что корреляция между двумя переменными не обязательно означает, что одна переменная вызывает появление другой.

Чтобы лучше понять эту фразу, рассмотрим следующие примеры из реальной жизни.

Пример 1: Продажа мороженого и нападения акул

Если мы собираем данные о ежемесячных продажах мороженого и ежемесячных нападениях акул в Соединенных Штатах каждый год, мы обнаружим, что эти две переменные сильно коррелированы.

Означает ли это, что употребление мороженого вызывает нападения акул?

Не совсем. Более вероятное объяснение состоит в том, что больше людей едят мороженое и купаются в океане, когда на улице теплее, что объясняет, почему эти две переменные так сильно коррелируют.

Хотя продажи мороженого и нападения акул тесно связаны, одно не вызывает другого.

Пример 2: Степени магистра и кассовые сборы

Если мы соберем данные об общем количестве степеней магистра, выдаваемых университетами каждый год, и общих кассовых сборах, полученных за год, мы обнаружим, что эти две переменные сильно коррелированы.

Означает ли это, что выдача большего количества степеней магистра приводит к ежегодному увеличению кассовых сборов?

Не совсем. Более вероятное объяснение состоит в том, что население мира увеличивается с каждым годом, а это означает, что каждый год выдается больше степеней магистра, а общее количество людей, посещающих кино каждый год, увеличивается примерно в равной степени.

Хотя эти две переменные взаимосвязаны, одна не является причиной другой.

Пример 3: Утопление в бассейне против производства ядерной энергии

Если мы соберем данные об общем количестве утонувших в бассейне каждый год и об общем количестве энергии, производимой атомными электростанциями каждый год, мы обнаружим, что эти две переменные сильно коррелированы.

Означает ли это, что учащение случаев утопления в бассейне каким-то образом приводит к увеличению производства ядерной энергии?

Не совсем. Более вероятное объяснение заключается в том, что население планеты увеличивается, а это означает, что все больше людей тонет в бассейнах, а производство ядерной энергии с каждым годом становится все более жизнеспособным, что объясняет, почему оно увеличилось.

Хотя эти две переменные сильно коррелированы, одна не является причиной другой.

Пример 4: Заболеваемость корью и уровень брачности

Если мы соберем данные об общем числе случаев кори в США каждый год и о количестве брачностей каждый год, мы обнаружим, что эти две переменные сильно коррелированы.

Означает ли это, что снижение заболеваемости корью приводит к снижению числа браков?

Не совсем. Наоборот, две переменные независимы: современная медицина снижает заболеваемость корью, и с каждым годом все меньше людей вступают в брак по разным причинам.

Хотя эти две переменные сильно коррелированы, одна не является причиной другой.

Пример 5: Выпускники средних школ и потребление пиццы

Если мы соберем данные об общем количестве выпускников средних школ и общем потреблении пиццы в США каждый год, мы обнаружим, что эти две переменные сильно коррелированы.

Означает ли это, что увеличение числа выпускников средних школ приводит к увеличению потребления пиццы в Соединенных Штатах?

Не совсем. Более вероятное объяснение состоит в том, что население США со временем увеличивается, а это означает, что количество людей, получающих высшее образование, и общее количество потребляемой пиццы увеличивается по мере роста населения.

Хотя эти две переменные взаимосвязаны, одна не является причиной другой.

Дополнительные ресурсы

В следующих руководствах представлена дополнительная информация о корреляции:

Введение в коэффициент корреляции Пирсона
Подразумевает ли причинно-следственная связь корреляцию?
Корреляция против ассоциации: в чем разница?
Что считается «сильной» корреляцией?
Когда следует использовать корреляцию?