Как создать и интерпретировать кривую ROC в Stata

Как создать и интерпретировать кривую ROC в Stata

Логистическая регрессия — это статистический метод, который мы используем для подбора модели регрессии, когда переменная отклика является бинарной. Чтобы оценить, насколько хорошо модель логистической регрессии соответствует набору данных, мы можем взглянуть на следующие две метрики:

  • Чувствительность: вероятность того, что модель предсказывает положительный результат для наблюдения, когда результат действительно положительный.
  • Специфичность: вероятность того, что модель предсказывает отрицательный результат для наблюдения, когда результат действительно отрицательный.

Один из простых способов визуализировать эти две метрики — создать кривую ROC , представляющую собой график, отображающий чувствительность и специфичность модели логистической регрессии.

В этом руководстве объясняется, как создать и интерпретировать кривую ROC в Stata.

Пример: кривая ROC в Stata

В этом примере мы будем использовать набор данных с именем lbw , который содержит следующие переменные для 189 матерей:

  • низкий – был ли у ребенка низкий вес при рождении. 1 = да, 0 = нет.
  • возраст – возраст матери.
  • курить – курила ли мать во время беременности. 1 = да, 0 = нет.

Мы подгоним модель логистической регрессии к данным, используя возраст и курение в качестве объясняющих переменных и низкий вес при рождении в качестве переменной отклика. Затем мы создадим кривую ROC, чтобы проанализировать, насколько хорошо модель соответствует данным.

Шаг 1: Загрузите и просмотрите данные.

Загрузите данные с помощью следующей команды:

используйте http://www.stata-press.com/data/r13/lbw

Получите быстрое представление о наборе данных, используя следующую команду:

подвести итог
Набор данных о низком весе при рождении в Stata

В наборе данных есть 11 различных переменных, но нас интересуют только три: низкий уровень, возраст и курение.

Шаг 2: Подберите модель логистической регрессии.

Используйте следующую команду, чтобы подобрать модель логистической регрессии:

логит низкий возраст курить
Вывод логистической регрессии в Stata

Шаг 3: Создайте кривую ROC.

Мы можем создать кривую ROC для модели, используя следующую команду:

лрок
Кривая ROC в Stata

Шаг 4: Интерпретируйте кривую ROC.

Когда мы подбираем модель логистической регрессии, ее можно использовать для расчета вероятности того, что данное наблюдение имеет положительный результат, на основе значений переменных-предикторов.

Чтобы определить, следует ли классифицировать наблюдение как положительное, мы можем выбрать точку отсечения таким образом, чтобы наблюдения с подобранной вероятностью выше точки отсечения классифицировались как положительные, а любые наблюдения с подобранной вероятностью ниже точки отсечения классифицировались как отрицательные. .

Например, предположим, что мы выбрали точку отсечения равной 0,5. Это означает, что любое наблюдение с подобранной вероятностью больше 0,5 будет иметь положительный результат, в то время как любое наблюдение с подобранной вероятностью меньше или равной 0,5 будет иметь отрицательный результат.

Кривая ROC показывает нам значения чувствительности по сравнению с 1-специфичностью по мере того, как значение точки отсечки изменяется от 0 до 1. Модель с высокой чувствительностью и высокой специфичностью будет иметь кривую ROC, которая охватывает верхний левый угол участок. Модель с низкой чувствительностью и низкой специфичностью будет иметь кривую, близкую к диагональной линии под углом 45 градусов.

AUC (площадь под кривой) дает нам представление о том, насколько хорошо модель способна различать положительные и отрицательные результаты. AUC может варьироваться от 0 до 1. Чем выше AUC, тем лучше модель правильно классифицирует результаты. В нашем примере мы видим, что AUC составляет 0,6111 .

Мы можем использовать AUC для сравнения производительности двух или более моделей. Модель с более высоким AUC работает лучше всего.

Дополнительные ресурсы

Как выполнить логистическую регрессию в Stata
Как интерпретировать кривую ROC и AUC модели логистической регрессии

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.