Логистическая регрессия относится к любой модели регрессии, в которой переменная ответа является категориальной.
Существует три типа моделей логистической регрессии:
- Бинарная логистическая регрессия : переменная ответа может принадлежать только к одной из двух категорий.
- Полиномиальная логистическая регрессия : переменная ответа может принадлежать к одной из трех или более категорий, и среди категорий нет естественного порядка.
- Порядковая логистическая регрессия : переменная ответа может принадлежать к одной из трех или более категорий, и среди категорий существует естественный порядок.
В следующей таблице приведены эти различия:
В этом руководстве представлено краткое объяснение каждого типа модели логистической регрессии, а также примеры каждого из них.
Тип № 1: Бинарная логистическая регрессия
Модели бинарной логистической регрессии — это тип логистической регрессии, в котором переменная отклика может принадлежать только к двум категориям.
Вот пара примеров:
Пример 1: Драфт НБА
Предположим, специалист по спортивным данным хочет использовать переменные-предикторы (1) очки, (2) подборы и (3) передачи, чтобы предсказать вероятность того, что данный баскетболист из колледжа попадет в НБА.
Поскольку есть только два возможных результата (черновик или не черновик) для переменной ответа, специалист по данным должен использовать модель биномиальной логистической регрессии.
Пример 2: Обнаружение спама
Предположим, компания хочет использовать переменные-предикторы (1) количество слов и (2) страну происхождения, чтобы предсказать вероятность того, что данное электронное письмо является спамом.
Поскольку есть только два возможных результата (спам или не спам) для переменной ответа, бизнес будет использовать модель биномиальной логистической регрессии.
Тип № 2: полиномиальная логистическая регрессия
Полиномиальные модели логистической регрессии представляют собой тип логистической регрессии, в котором переменная отклика может принадлежать к одной из трех или более категорий, и среди категорий нет естественного порядка.
Вот пара примеров:
Пример 1: Политические предпочтения
Предположим, политолог хочет использовать переменные-предикторы (1) годовой доход и (2) количество лет образования, чтобы предсказать вероятность того, что человек проголосует за одного из четырех разных кандидатов в президенты.
Поскольку существует более двух возможных результатов (существует четыре потенциальных кандидата) для переменной отклика и нет естественного упорядочения результатов, политолог может использовать модель полиномиальной логистической регрессии.
Пример 2: Спортивные предпочтения
Предположим, спортивный аналитик хочет использовать переменные-предикторы (1) часы просмотра телевизора в неделю и (2) возраст, чтобы предсказать вероятность того, что человек выберет баскетбол, футбол или бейсбол в качестве предпочтительного вида спорта.
Поскольку существует более двух возможных результатов (есть три вида спорта) для переменной отклика, спортивный аналитик будет использовать модель полиномиальной логистической регрессии.
Тип № 3: порядковая логистическая регрессия
Порядковые модели логистической регрессии представляют собой тип логистической регрессии, в котором переменная отклика может принадлежать к одной из трех или более категорий, и среди категорий существует естественный порядок.
Вот пара примеров:
Пример 1: Школьные рейтинги
Предположим, академический консультант хочет использовать переменные-предикторы (1) средний балл, (2) балл ACT и (3) балл SAT, чтобы предсказать вероятность того, что человек поступит в университет, который можно разделить на «плохой», «посредственный». », «хорошо» или «отлично».
Поскольку существует более двух возможных результатов (существует четыре классификации качества школы) для переменной ответа и имеется естественное упорядочение результатов, научный руководитель будет использовать модель порядковой логистической регрессии.
Пример 2: рейтинги фильмов
Предположим, кинокритик хочет использовать переменные-предикторы (1) общее время показа и (2) жанр, чтобы предсказать вероятность того, что данный фильм получит рейтинг от 1 до 10.
Поскольку существует более двух возможных результатов (существует 10 возможных оценок) для переменной ответа и существует естественное упорядочение результатов, кинокритик будет использовать модель порядковой логистической регрессии.
Дополнительные ресурсы
В следующих руководствах представлены более подробные сведения о моделях логистической регрессии:
Введение в логистическую регрессию
6 допущений логистической регрессии
4 примера использования логистической регрессии в реальной жизни