Как создать график взаимодействия в R

Как создать график взаимодействия в R

Двухфакторный дисперсионный анализ используется, чтобы определить, есть ли разница между средними значениями трех или более независимых групп, которые были разделены на два фактора.

Мы используем двусторонний дисперсионный анализ, когда хотим узнать, влияют ли два конкретных фактора на определенную переменную отклика. Однако иногда между двумя факторами присутствует эффект взаимодействия , который может повлиять на то, как мы интерпретируем взаимосвязь между факторами и переменной отклика.

Например, мы можем захотеть узнать, влияют ли факторы (1) физические упражнения и (2) пол на переменную реакции на потерю веса.Хотя возможно, что оба фактора влияют на потерю веса, также возможно, что эти два фактора взаимодействуют друг с другом.

Например, возможно, что физические упражнения приводят к потере веса с разной скоростью у мужчин и женщин. В этом случае существует эффект взаимодействия между физическими упражнениями и полом.

Самый простой способ обнаружить и понять эффекты взаимодействия между двумя факторами — это построить график взаимодействия .

Это тип графика, который отображает подогнанные значения переменной отклика по оси Y и значения первого фактора по оси X. Между тем линии на графике представляют значения второго интересующего фактора.

График взаимодействия в R

В этом руководстве объясняется, как создать и интерпретировать график взаимодействия в R.

Пример: График взаимодействия в R

Предположим, исследователи хотят определить, влияют ли интенсивность упражнений и пол на потерю веса. Чтобы проверить это, они набирают 30 мужчин и 30 женщин для участия в эксперименте, в котором они случайным образом распределяют по 10 человек для выполнения программы либо без упражнений, либо с легкими, либо с интенсивными упражнениями в течение одного месяца.

Используйте следующие шаги, чтобы создать фрейм данных в R, выполнить двусторонний ANOVA и создать график взаимодействия, чтобы визуализировать эффект взаимодействия между физическими упражнениями и полом.

Шаг 1: Создайте данные.

Следующий код показывает, как создать фрейм данных в R:

#make this example reproducible
set.seed(10)

#create data frame
data <- data.frame(gender = rep (c("Male", "Female"), each = 30 ),
 exercise = rep (c("None", "Light", "Intense"), each = 10 , times = 2 ),
 weight_loss = c(runif(10, -3, 3), runif(10, 0, 5), runif(10, 5, 9),
 runif(10, -4, 2), runif(10, 0, 3), runif(10, 3, 8)))

#view first six rows of data frame
head(data)

 gender exercise weight_loss
1 Male None 0.04486922
2 Male None -1.15938896
3 Male None -0.43855400
4 Male None 1.15861249
5 Male None -2.48918419
6 Male None -1.64738030

Шаг 2: Установите двухфакторную модель ANOVA.

В следующем коде показано, как применить двухфакторный дисперсионный анализ к данным:

#fit the two-way ANOVA model
model <- aov(weight_loss ~ gender \* exercise, data = data)

#view the model output
summary(model)

# Df Sum Sq Mean Sq F value Pr(>F) 
#gender 1 15.8 15.80 11.197 0.0015 \*\* 
#exercise 2 505.6 252.78 179.087 <2e-16 \*\*\*
#gender:exercise 2 13.0 6.51 4.615 0.0141 \* 
#Residuals 54 76.2 1.41 
#---
#Signif. codes: 0 '\*\*\*' 0.001 '\*\*' 0.01 '\*' 0.05 '.' 0.1 ' ' 1

Обратите внимание, что значение p ( 0,0141 ) для термина взаимодействия между физическими упражнениями и полом является статистически значимым, что указывает на наличие значительного эффекта взаимодействия между двумя факторами.

Шаг 3: Создайте график взаимодействия.

В следующем коде показано, как создать график взаимодействия для упражнений и пола:

interaction.plot(x.factor = data$exercise, #x-axis variable
 trace.factor = data$gender, #variable for lines
 response = data$weight_loss, #y-axis variable
 fun = median, #metric to plot
 ylab = "Weight Loss",
 xlab = "Exercise Intensity",
 col = c("pink", "blue"),
 lty = 1, #line type
 lwd = 2, #line width
 trace.label = "Gender")
График взаимодействия в R

В общем, если две линии на графике взаимодействия параллельны, то эффекта взаимодействия нет. Однако, если линии пересекаются, то, вероятно, существует эффект взаимодействия.

На этом графике мы видим, что линии для мужчин и женщин пересекаются, что указывает на то, что, вероятно, существует эффект взаимодействия между переменными интенсивностью упражнений и полом.

Это соответствует тому факту, что значение p в выходных данных таблицы ANOVA было статистически значимым для члена взаимодействия в модели ANOVA.

Дополнительные ресурсы

Как провести односторонний дисперсионный анализ в R
Как провести двухсторонний ANOVA в R

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.