Как выполнить MANOVA в Stata

Как выполнить MANOVA в Stata

Однофакторный дисперсионный анализ используется для определения того, приводят ли различные уровни объясняющей переменной к статистически различным результатам в некоторой переменной отклика.

Например, нам может быть интересно понять, приводят ли три уровня образования (степень младшего специалиста, степень бакалавра, степень магистра) к статистически разным годовым доходам. В этом случае у нас есть одна объясняющая переменная и одна переменная отклика.

  • Объясняющая переменная: уровень образования
  • Переменная ответа: годовой доход

MANOVA — это расширение однофакторного дисперсионного анализа, в котором имеется более одной переменной отклика. Например, нам может быть интересно понять, приводит ли уровень образования к разным годовым доходам и разным суммам долга по студенческим кредитам. В этом случае у нас есть одна объясняющая переменная и две переменные отклика:

  • Объясняющая переменная: уровень образования
  • Переменные ответа: годовой доход, задолженность по студенческому кредиту.

Поскольку у нас есть более одной переменной отклика, в этом случае было бы уместно использовать MANOVA.

Далее мы объясним, как выполнить MANOVA в Stata.

Пример: MANOVA в Stata

Чтобы проиллюстрировать, как выполнить MANOVA в Stata, мы будем использовать следующий набор данных, который содержит следующие три переменные для 24 человек:

  • educ: уровень образования (0 = Associate, 1 = Bachelor, 2 = Master)
  • доход: годовой доход
  • долг: общая задолженность по студенческому кредиту
Пример MANOVA в Stata

Вы можете воспроизвести этот пример, самостоятельно введя данные вручную, выбрав « Данные» > «Редактор данных» > «Редактор данных» (Правка) в верхней строке меню.

Чтобы выполнить MANOVA, используя образование в качестве объясняющей переменной, а доход и долг в качестве переменных отклика, мы можем использовать следующую команду:

задолженность по доходам manova = образование
Вывод MANOVA в Stata

Stata выдает четыре уникальных статистических показателя теста вместе с соответствующими значениями p:

Лямбда Уилкса: F-статистика = 5,02, P-значение = 0,0023.

Кривая Пиллаи: F-статистика = 4,07, P-значение = 0,0071.

Кривая Лоули-Хотеллинга: F-статистика = 5,94, P-значение = 0,0008.

Наибольший корень Роя: F-статистика = 13,10, P-значение = 0,0002.

Подробное объяснение того, как рассчитывается статистика каждого теста, см. в этой статье Научного колледжа штата Пенсильвания в Эберли.

Значение p для каждой тестовой статистики меньше 0,05, поэтому нулевая гипотеза будет отклонена независимо от того, какую из них вы используете. Это означает, что у нас есть достаточно доказательств, чтобы сказать, что уровень образования приводит к статистически значимым различиям в годовом доходе и общем студенческом долге.

Примечание о p-значениях: буква рядом со значением p в выходной таблице указывает, как была рассчитана F-статистика (e = точное вычисление, a = приблизительное вычисление, u = верхняя граница).

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.