Фраза « корреляция не подразумевает причинно -следственной связи» часто используется в статистике, чтобы указать, что корреляция между двумя переменными не обязательно означает, что одна переменная вызывает появление другой.
Чтобы лучше понять эту фразу, рассмотрим следующие примеры из реальной жизни.
Пример 1: Продажа мороженого и нападения акул
Если мы собираем данные о ежемесячных продажах мороженого и ежемесячных нападениях акул в Соединенных Штатах каждый год, мы обнаружим, что эти две переменные сильно коррелированы.

Означает ли это, что употребление мороженого вызывает нападения акул?
Не совсем. Более вероятное объяснение состоит в том, что больше людей едят мороженое и купаются в океане, когда на улице теплее, что объясняет, почему эти две переменные так сильно коррелируют.
Хотя продажи мороженого и нападения акул тесно связаны, одно не вызывает другого.
Пример 2: Степени магистра и кассовые сборы
Если мы соберем данные об общем количестве степеней магистра, выдаваемых университетами каждый год, и общих кассовых сборах, полученных за год, мы обнаружим, что эти две переменные сильно коррелированы.

Означает ли это, что выдача большего количества степеней магистра приводит к ежегодному увеличению кассовых сборов?
Не совсем. Более вероятное объяснение состоит в том, что население мира увеличивается с каждым годом, а это означает, что каждый год выдается больше степеней магистра, а общее количество людей, посещающих кино каждый год, увеличивается примерно в равной степени.
Хотя эти две переменные взаимосвязаны, одна не является причиной другой.
Пример 3: Утопление в бассейне против производства ядерной энергии
Если мы соберем данные об общем количестве утонувших в бассейне каждый год и об общем количестве энергии, производимой атомными электростанциями каждый год, мы обнаружим, что эти две переменные сильно коррелированы.

Означает ли это, что учащение случаев утопления в бассейне каким-то образом приводит к увеличению производства ядерной энергии?
Не совсем. Более вероятное объяснение заключается в том, что население планеты увеличивается, а это означает, что все больше людей тонет в бассейнах, а производство ядерной энергии с каждым годом становится все более жизнеспособным, что объясняет, почему оно увеличилось.
Хотя эти две переменные сильно коррелированы, одна не является причиной другой.
Пример 4: Заболеваемость корью и уровень брачности
Если мы соберем данные об общем числе случаев кори в США каждый год и о количестве брачностей каждый год, мы обнаружим, что эти две переменные сильно коррелированы.

Означает ли это, что снижение заболеваемости корью приводит к снижению числа браков?
Не совсем. Наоборот, две переменные независимы: современная медицина снижает заболеваемость корью, и с каждым годом все меньше людей вступают в брак по разным причинам.
Хотя эти две переменные сильно коррелированы, одна не является причиной другой.
Пример 5: Выпускники средних школ и потребление пиццы
Если мы соберем данные об общем количестве выпускников средних школ и общем потреблении пиццы в США каждый год, мы обнаружим, что эти две переменные сильно коррелированы.

Означает ли это, что увеличение числа выпускников средних школ приводит к увеличению потребления пиццы в Соединенных Штатах?
Не совсем. Более вероятное объяснение состоит в том, что население США со временем увеличивается, а это означает, что количество людей, получающих высшее образование, и общее количество потребляемой пиццы увеличивается по мере роста населения.
Хотя эти две переменные взаимосвязаны, одна не является причиной другой.
Дополнительные ресурсы
В следующих руководствах представлена дополнительная информация о корреляции:
Введение в коэффициент корреляции Пирсона
Подразумевает ли причинно-следственная связь корреляцию?
Корреляция против ассоциации: в чем разница?
Что считается «сильной» корреляцией?
Когда следует использовать корреляцию?