Как выполнить односторонний ANOVA в Stata

Как выполнить односторонний ANOVA в Stata

Однофакторный дисперсионный анализ используется для определения того, существует ли статистически значимое различие между средними значениями трех или более независимых групп.

Этот тип теста называется односторонним дисперсионным анализом, потому что мы анализируем, как одна предикторная переменная влияет на переменную отклика. Если бы вместо этого нас интересовало, как две переменные-предикторы влияют на переменную отклика, мы могли бы провести двусторонний дисперсионный анализ .

В этом руководстве объясняется, как провести однофакторный дисперсионный анализ в Stata.

Пример: Однофакторный дисперсионный анализ в Stata

В этом примере мы будем использовать встроенный набор данных Stata, называемый систолическим , для выполнения одностороннего дисперсионного анализа. Этот набор данных содержит следующие три переменные для 58 разных людей:

  • Используемый наркотик
  • Болезнь пациента
  • Изменение систолического артериального давления

Мы будем использовать следующие шаги, чтобы выполнить односторонний ANOVA, чтобы выяснить, приводит ли тип используемого препарата к значительному влиянию на изменение систолического артериального давления.

Шаг 1: Загрузите данные.

Сначала загрузите данные, введя webuse systolic в поле команды и нажав Enter.

Пример загрузки данных в Stata

Шаг 2: Просмотрите необработанные данные.

Прежде чем мы выполним однофакторный дисперсионный анализ, давайте сначала просмотрим необработанные данные. В верхней строке меню выберите Данные > Редактор данных > Редактор данных (Обзор).Это покажет нам фактические данные для всех 58 пациентов:

Пример одностороннего ANOVA в Stata

Шаг 3: Визуализируйте данные.

Далее, давайте визуализируем данные. Мы создадим диаграммы для просмотра распределения значений систолического артериального давления для каждой категории лекарств.

В верхней строке меню перейдите к Graphics > Box plot.В разделе «Переменные» выберите «Систолическое»:

Блочная диаграмма в Стате

Затем в подзаголовке «Категории» под переменной «Группировка» выберите препарат:

Пример Boxplot в Stata

Нажмите ОК.Автоматически отобразится диаграмма с четырьмя ящичковыми диаграммами:

Несколько коробочных диаграмм в Stata

Мы можем сразу увидеть, что распределение изменений систолического артериального давления различается между категориями лекарств, но однофакторный дисперсионный анализ покажет нам, являются ли эти различия статистически значимыми.

Шаг 4: Выполните односторонний ANOVA.

В верхней строке меню перейдите к Статистика> Линейные модели и связанные с ними> ANOVA/MANOVA> One-Way ANOVA .

Под переменной ответа выберите систолическое. Под факторной переменной выберите препарат. Затем установите флажок « Создать сводную таблицу », чтобы мы могли видеть некоторые основные описательные статистические данные для каждой группы. Затем нажмите ОК .

Пример одностороннего ANOVA в Stata

Будет отображен следующий вывод:

Односторонний ANOVA в Stata

F-статистика равна 9,09 , а соответствующее значение p равно 0,0001.Поскольку значение p меньше, чем альфа = 0,05, мы можем отвергнуть нулевую гипотезу о том, что среднее изменение систолического артериального давления для каждой группы одинаково.

Другими словами, существует статистически значимая разница в среднем изменении систолического артериального давления по крайней мере между двумя группами препаратов.

Шаг 5: Проведите несколько сравнительных тестов.

Затем мы можем выполнить несколько сравнительных тестов, чтобы выяснить, какие средние значения групп отличаются друг от друга.

В верхней строке меню выберите Статистика > Сводки, таблицы и тесты > Сводная и описательная статистика > Попарные сравнения средних .

Для Variable выберите переменную ответа systolic.Для Over выберите независимую переменную Drug.Для корректировки множественных сравнений выберите метод Тьюки .

Множественные сравнения для однофакторного дисперсионного анализа в Stata

Затем в подзаголовке « Отчетность » нажмите кнопку рядом с « Таблицы эффектов » и установите флажок « Показать таблицу эффектов с доверительными интервалами и p-значениями».Затем нажмите ОК .

Множественные сравнения в Stata

Будут отображены следующие результаты:

Тест Тьюки в результатах Stata

Каждая строка представляет собой сравнение между двумя конкретными группами препаратов. Например, в первой строке сравнивается среднее изменение систолического артериального давления между группой препаратов 2 и группой препаратов 1. Значение p для этого сравнения составляет 0,999 , что является очень высоким показателем и не меньше 0,05. Это означает, что нет статистически значимой разницы между группами препаратов 1 и 2.

Однако мы видим, что все значения p для следующих сравнений меньше 0,05:

  • наркотик 3 против 1 | p-значение = 0,001
  • наркотик 4 против 1 | р-значение = 0,010
  • наркотик 3 против 2 | p-значение = 0,001
  • наркотик 4 против 2 | р-значение = 0,015

Это означает, что разница в изменении среднего систолического артериального давления статистически значима между каждой из этих групп.

Шаг 6: Сообщите о результатах.

Наконец, мы сообщим о результатах нашего анализа One-Way ANOVA. Вот пример того, как это сделать:


Был проведен однофакторный дисперсионный анализ, чтобы определить, оказывают ли четыре разных типа лекарств различное влияние на систолическое артериальное давление.

В следующей таблице суммировано количество участников в каждой группе, а также среднее изменение систолического артериального давления и стандартное отклонение систолического артериального давления для каждой группы:

Описательная статистика для однофакторного дисперсионного анализа в Stata

Однофакторный дисперсионный анализ показал наличие статистически значимой разницы по меньшей мере между двумя группами (F(3, 54) = 9,09, p = 0,001).

Тест Тьюки для множественных сравнений показал, что изменение систолического артериального давления было статистически значимо выше для препарата 3 по сравнению с препаратом 1 (17,32 ± 4,15, р = 0,001), для препарата 3 по сравнению с препаратом 2 (16,78 ± 4,15, р = 0,001). р = 0,001), для препарата 4 по сравнению с препаратом 1 (12,57 +/- 3,85, р = 0,010) и для препарата 4 по сравнению с препаратом 2 (12,03 +/- 3,85, р = 0,015).

Не было статистически значимой разницы между группами препаратов 1 и 2 (0,533 ± 3,91, p = 0,999) или между группами препаратов 3 и 4 (4,75 ± 4,09, p = 0,654).

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.