Когда использовать ранговую корреляцию Спирмена (2 сценария)

Когда использовать ранговую корреляцию Спирмена (2 сценария)

Наиболее распространенным способом количественной оценки линейной связи между двумя переменными является использованиекоэффициента корреляции Пирсона , который всегда принимает значение от -1 до 1, где:

  • -1 указывает на совершенно отрицательную линейную корреляцию
  • 0 указывает на отсутствие линейной корреляции
  • 1 указывает на совершенно положительную линейную корреляцию

Однако этот тип коэффициента корреляции работает лучше всего, когда истинная основная связь между двумя переменными является линейной .

Существует еще один тип коэффициента корреляции, известный как ранговая корреляция Спирмена, который лучше использовать в двух конкретных сценариях:

Сценарий 1 : при работе с ранжированными данными.

  • Примером может быть набор данных, который содержит оценку экзамена по математике учащегося, а также оценку его оценки на экзамене по естественным наукам в классе.

Сценарий 2 : При наличии одного или нескольких экстремальных выбросов.

  • Когда в наборе данных присутствуют экстремальные выбросы, это сильно влияет на коэффициент корреляции Пирсона.

В следующих примерах показано, как рассчитать ранговую корреляцию Спирмена в каждом из этих сценариев.

Сценарий 1: ранговая корреляция Спирмена с ранжированными данными

Рассмотрим следующий набор данных (и соответствующий график рассеяния), который показывает взаимосвязь между двумя переменными:

Используя статистическое программное обеспечение, мы можем рассчитать следующие коэффициенты корреляции для этих двух переменных:

  • Корреляция Пирсона: 0,79
  • Ранговая корреляция Спирмена: 1

В этом сценарии, если нас интересуют только ранги значений данных (когда ранг x увеличивается, ранг y также увеличивается?), тогда ранговая корреляция Спирмена даст нам лучшее представление о корреляции между двумя переменными. .

В этом конкретном наборе данных по мере увеличения ранга x ранг y всегда увеличивается.

Ранговая корреляция Спирмена прекрасно отражает это поведение, говоря нам, что существует совершенная положительная связь ( ρ = 1 ) между рангами x и рангами y.

Напротив, корреляция Пирсона говорит нам о наличии сильной линейной зависимости ( r = 0,79 ) между двумя переменными.

Это верно, но бесполезно, если нас интересует только соотношение между рангами x и рангами y.

Сценарий 2. Ранговая корреляция Спирмена с экстремальными выбросами

Рассмотрим следующий набор данных (и соответствующий график рассеяния), который показывает взаимосвязь между двумя переменными:

Используя статистическое программное обеспечение, мы можем рассчитать следующие коэффициенты корреляции для этих двух переменных:

  • Корреляция Пирсона: 0,86
  • Ранговая корреляция Спирмена: 0,85

Коэффициенты корреляции почти идентичны, потому что основная связь между переменными является примерно линейной и нет экстремальных выбросов.

Теперь предположим, что мы изменили последнее значение y в наборе данных, сделав его экстремальным выбросом:

Используя статистическое программное обеспечение, мы можем еще раз рассчитать коэффициенты корреляции:

  • Корреляция Пирсона: 0,69
  • Ранговая корреляция Спирмена: 0,85

Коэффициент корреляции Пирсона резко изменился, в то время как коэффициент ранговой корреляции Спирмена остался прежним.

Используя статистический жаргон, мы бы сказали, что связь между x и y является монотонной (по мере увеличения x обычно увеличивается y), но нелинейной, поскольку выбросы очень сильно влияют на данные.

В этом сценарии ранговая корреляция Спирмена хорошо справляется с количественной оценкой этой монотонной зависимости, в то время как корреляция Пирсона работает плохо, потому что пытается вычислить линейную связь между двумя переменными.

Связанный: Как сообщить о ранговой корреляции Спирмена в формате APA

Дополнительные ресурсы

В следующих руководствах объясняется, как рассчитать ранговую корреляцию Спирмена с использованием другого программного обеспечения:

Как рассчитать ранговую корреляцию Спирмена в Excel
Как рассчитать ранговую корреляцию Спирмена в Google Sheets
Как рассчитать ранговую корреляцию Спирмена в R
Как рассчитать ранговую корреляцию Спирмена в Python

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.