Положительная прогностическая ценность и чувствительность: в чем разница?

Положительная прогностическая ценность и чувствительность: в чем разница?

Одним из наиболее распространенных способов оценки эффективности модели классификации является создание матрицы путаницы, которая суммирует прогнозируемые результаты модели по сравнению с фактическими результатами набора данных.

Две метрики, которые нас часто интересуют в матрице путаницы, — это положительная прогностическая ценность и чувствительность .

Положительная прогностическая ценность — это вероятность того, что наблюдение с положительным прогнозируемым результатом действительно имеет положительный результат.

Он рассчитывается как:

Положительное прогностическое значение = истинные положительные результаты / (истинные положительные результаты + ложные положительные результаты)

Чувствительность — это вероятность того, что наблюдение с положительным результатом действительно имеет положительный прогнозируемый результат.

Он рассчитывается как:

Чувствительность = истинные положительные результаты / (истинные положительные результаты + ложноотрицательные результаты)

В следующем примере показано, как рассчитать обе эти метрики на практике.

Пример: расчет положительной прогностической ценности и чувствительности

Предположим, врач использует модель логистической регрессии, чтобы предсказать, есть ли у 400 человек определенное заболевание.

Следующая матрица путаницы суммирует прогнозы, сделанные моделью:

Мы бы рассчитали положительную прогностическую ценность как:

  • Положительное прогностическое значение = истинные положительные результаты / (истинные положительные результаты + ложные положительные результаты)
  • Положительная прогностическая ценность = 15/(15 + 10)
  • Положительная прогностическая ценность = 0,60

Это говорит нам о том, что вероятность того, что человек, получивший положительный результат теста, действительно болен , равна 0,60 .

Мы рассчитываем чувствительность как:

  • Чувствительность = истинные положительные результаты / (истинные положительные результаты + ложноотрицательные результаты)
  • *Чувствительность* = 15/(15+5)
  • Чувствительность = 0,75

Это говорит нам о том, что вероятность того, что человек, у которого есть заболевание, действительно получит положительный результат теста, равна 0,75 .

Дополнительные ресурсы

В следующих руководствах объясняется, как создать матрицу путаницы в различных статистических программах:

Как создать матрицу путаницы в Excel
Как создать матрицу путаницы в R
Как создать матрицу путаницы в Python

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.