Как рассчитать d Коэна в R (с примером)


В статистике мы часто используем p-значения , чтобы определить, есть ли статистически значимая разница между средним значением двух групп.

Однако в то время как p-значение может сказать нам, есть ли статистически значимая разница между двумя группами, размер эффекта может сказать нам, насколько велика эта разница на самом деле.

Одним из наиболее распространенных измерений размера эффекта является d Коэна , который рассчитывается как:

d Коэна = ( x 1 – x 2 ) / √ (s 1 2 + s 2 2 ) / 2

куда:

  • x 1 , x 2 : среднее значение выборки 1 и выборки 2 соответственно.
  • s 1 2 , s 2 2 : дисперсия выборки 1 и выборки 2 соответственно.

Используя эту формулу, вот как мы интерпретируем d Коэна:

  • Значение d , равное 0,5 , указывает на то, что средние значения двух групп отличаются на 0,5 стандартных отклонения.
  • Значение d , равное 1 , указывает на то, что средние группы отличаются на 1 стандартное отклонение.
  • Значение d , равное 2 , указывает на то, что средние группы отличаются на 2 стандартных отклонения.

И так далее.

Вот еще один способ интерпретации d Коэна: размер эффекта 0,5 означает, что значение среднего человека в группе 1 на 0,5 стандартных отклонения выше среднего человека в группе 2.

Мы часто используем следующее эмпирическое правило при интерпретации d Коэна:

  • Значение 0,2 представляет небольшой размер эффекта.
  • Значение 0,5 представляет средний размер эффекта.
  • Значение 0,8 представляет большой размер эффекта.

В следующем примере показано, как вычислить d Коэна в R.

Пример: как рассчитать d Коэна в R

Предположим, ботаник применяет к растениям два разных удобрения, чтобы определить, есть ли существенная разница в среднем росте растений (в дюймах) через месяц.

Есть два метода, которые мы можем использовать для быстрого вычисления d Коэна в R:

Способ 1: использовать пакет lsr

library (lsr)

#define plant growth values for each group
group1 <- c(8, 9, 11, 11, 12, 14, 15, 16, 16, 18, 20, 21)
group2 <- c(7, 9, 10, 10, 11, 11, 12, 14, 14, 16, 20, 23)

#calculate Cohen's d
cohensD(group1, group2)

[1] 0.2635333

Способ 2: использовать пакет effsize

library (effsize)

#define plant growth values for each group
group1 <- c(8, 9, 11, 11, 12, 14, 15, 16, 16, 18, 20, 21)
group2 <- c(7, 9, 10, 10, 11, 11, 12, 14, 14, 16, 20, 23)

#calculate Cohen's d
cohen.d(group1, group2)

Cohen's d

d estimate: 0.2635333 (small)
95 percent confidence interval:
 lower upper 
-0.5867889 1.1138555 

Обратите внимание, что оба метода дают одинаковый результат: d Коэна равно 0,2635 .

Мы интерпретируем это так, что средняя высота растений, получивших удобрение №1, на 0,2635 стандартного отклонения больше, чем средняя высота растений, получивших удобрение №2.

Используя эмпирическое правило, упомянутое ранее, мы бы интерпретировали это как небольшой размер эффекта.

Другими словами, независимо от того, существует ли статистически значимая разница в среднем росте растений между двумя удобрениями, фактическая разница между средними значениями группы тривиальна.

Дополнительные ресурсы

В следующих руководствах представлена дополнительная информация о величине эффекта и коэффициенте Коэна d:

Размер эффекта: что это такое и почему это важно
Как рассчитать d Коэна в Excel

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.