Корреляция против ассоциации: в чем разница?

Корреляция против ассоциации: в чем разница?

Два термина, которые иногда используются взаимозаменяемо, — это корреляция и ассоциация.Однако в области статистики эти два термина имеют несколько разные значения.

В частности, когда мы используем слово « корреляция », мы обычно говорим окоэффициенте корреляции Пирсона.Это мера линейной связи между двумя случайными величинами X и Y. Она имеет значение от -1 до 1, где:

  • -1 указывает на совершенно отрицательную линейную корреляцию между двумя переменными
  • 0 указывает на отсутствие линейной корреляции между двумя переменными
  • 1 указывает на совершенно положительную линейную корреляцию между двумя переменными.

И наоборот, когда статистики используют слово « ассоциация », они могут говорить о любых отношениях между двумя переменными, будь то линейные или нелинейные.

Чтобы проиллюстрировать эту мысль, рассмотрим следующие примеры.

Визуализация корреляции и ассоциации с диаграммами рассеяния

Мы используем два слова для описания корреляции между двумя случайными величинами:

1. Направление

  • Положительный: две случайные величины имеют положительную корреляцию, если Y имеет тенденцию к увеличению с увеличением X.
  • Отрицательный: две случайные величины имеют отрицательную корреляцию, если Y имеет тенденцию к уменьшению по мере увеличения X.

2. Сила

  • Слабая: две случайные величины имеют слабую корреляцию, если точки на диаграмме рассеяния слабо разбросаны.
  • Сильная: две случайные величины имеют сильную корреляцию, если точки на диаграмме рассеяния плотно упакованы вместе.

Следующие диаграммы рассеяния иллюстрируют примеры каждого типа корреляции:

По сравнению с корреляцией слово « ассоциация » может сказать нам, существует ли какая- либо связь между двумя случайными величинами: линейная или нелинейная.

Следующие диаграммы рассеяния иллюстрируют некоторые примеры:

Корреляция против ассоциации

Диаграмма рассеяния в верхнем левом углу иллюстрирует квадратичную зависимость между двумя случайными переменными, что означает наличие связи между двумя переменными, но не линейной.

Если бы мы рассчитали корреляцию между двумя переменными, она, вероятно, была бы близка к нулю, потому что между ними нет линейной зависимости.

Однако простое знание того, что корреляция между двумя переменными равна нулю, может ввести в заблуждение, поскольку оно скрывает тот факт, что вместо этого существует нелинейная связь.

Корреляция против ассоциации: резюме

Термины корреляция и ассоциация имеют следующие сходства и различия:

Сходства:

  • Оба термина используются для описания того, существует ли связь между двумя случайными величинами.
  • Оба термина могут использовать диаграммы рассеяния для анализа взаимосвязи между двумя случайными величинами.

Отличия:

  • Корреляция может только сказать нам, имеют ли две случайные величины линейную связь, в то время как ассоциация может сказать нам, имеют ли две случайные величины линейную или нелинейную связь.
  • Корреляция количественно определяет связь между двумя случайными переменными, используя число от -1 до 1, но ассоциация не использует конкретное число для количественной оценки связи.

Дополнительные ресурсы

Введение в коэффициент корреляции Пирсона
Введение в диаграммы рассеяния
Корреляция против регрессии: в чем разница?

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.