Общеизвестно, что корреляция не подразумевает причинно -следственной связи.
В качестве простого примера, если мы собираем данные об общем количестве выпускников средних школ и общем потреблении пиццы в США каждый год, мы обнаружим, что эти две переменные сильно коррелированы:
Это не означает, что рост числа выпускников средних школ приводит к увеличению потребления пиццы.
Более вероятное объяснение состоит в том, что население США со временем увеличивается, а это означает, что количество людей, получающих высшее образование, и общее количество потребляемой пиццы увеличивается по мере роста населения.
Но как насчет обратного утверждения: предполагает ли причинно-следственная связь корреляцию?
Если одна переменная вызывает другую переменную, обязательно ли это означает, что две переменные будут коррелированы?
Краткий ответ: Нет .
Следующие примеры показывают, почему.
Пример 1: квадратичная зависимость
Предположим, что некоторая переменная X заставляет переменную Y принимать значение, равное X 2 .
Например:
- Если X = -10, то Y = -10 2 = 100
- Если X = 0, то Y = 0 2 = 0
- Если X = 10, то Y = 10 2 = 100
И так далее.
Если бы мы построили зависимость между X и Y, она выглядела бы так:
Если бы мы вычислиликоэффициент корреляции Пирсона между двумя переменными, мы бы обнаружили, что корреляция равна нулю .
Хотя X вызывает Y, линейная корреляция между двумя переменными равна нулю.
Пример 2: Четвертая связь
Предположим, что некоторая переменная X заставляет переменную Y принимать значение, равное X 4 .
Например:
- Если X = -10, то Y = -10 4 = 10 000
- Если X = 0, то Y = 0 4 = 0
- Если X = 10, то Y = 10 4 = 10 000
И так далее.
Если бы мы построили зависимость между X и Y, она выглядела бы так:
Если бы мы вычислиликоэффициент корреляции Пирсона между двумя переменными, мы бы обнаружили, что корреляция равна нулю .
Мы знаем, что X вызывает Y, но линейная корреляция между двумя переменными равна нулю.
Пример 3: Косинусное соотношение
Предположим, что некоторая переменная X заставляет переменную Y принимать значение, равное cos(X).
Например:
- Если X = -10, то Y = cos(-10) = -0,83907
- Если X = 0, то Y = cos(0) = 1
- Если X = 10, то Y = cos(10) = -0,83907.
И так далее.
Если бы мы построили зависимость между X и Y, она выглядела бы так:
Если бы мы вычислиликоэффициент корреляции Пирсона между двумя переменными, мы бы обнаружили, что корреляция равна нулю .
Мы знаем, что X вызывает Y, но линейная корреляция между двумя переменными равна нулю.
Дополнительные ресурсы
В следующих руководствах представлена дополнительная информация о корреляции и причинно-следственной связи:
Корреляция не подразумевает причинно-следственную связь: 5 реальных примеров
Введение в коэффициент корреляции Пирсона
Обратная причинность: определение и примеры