Дихотомическая переменная — это тип переменной, которая принимает только два возможных значения.
Некоторые примеры дихотомических переменных включают:
- Пол: мужской или женский
- Подбрасывание монеты: орел или решка
- Тип недвижимости: жилая или коммерческая
- Статус спортсмена: профессионал или любитель
- Результаты экзамена: сдан или не сдан
Эти типы переменных постоянно встречаются на практике. Например, рассмотрим следующий набор данных, содержащий 10 наблюдений и 4 переменные:
Переменные « пол » и « Выигранный чемпионат » дихотомичны, поскольку каждая из них может принимать только два возможных значения:
Однако переменные Division и Average Points не являются дихотомическими, поскольку могут принимать несколько значений.
Бонусный совет:
Вы можете вспомнить, что дихотомические переменные могут принимать только два значения, вспомнив, что префикс «ди» — это греческое слово, означающее «два», «дважды» или «двойной».
Как создать дихотомические переменные
Стоит отметить, что мы можем создать дихотомическую переменную из непрерывной переменной, просто разделив значения на основе некоторого порога.
Например, в предыдущем наборе данных мы могли бы превратить переменную « Средние очки » в дихотомическую переменную, классифицируя игроков со средним значением выше 15 как «высоко результативных», а тех, у кого среднее значение ниже 15, как «низко результативных»:
Как визуализировать дихотомические переменные
Обычно мы визуализируем дихотомические переменные, используя простую гистограмму для представления частот каждого значения, которое они могут принимать.
Например, на следующей гистограмме показаны частоты каждого пола в предыдущем наборе данных:
Мы также можем отобразить частоты в процентах по оси Y:
Это позволяет нам легко увидеть, что 70% всех спортсменов в наборе данных — мужчины, а 30% — женщины.
Как анализировать дихотомические переменные
Существует несколько способов анализа дихотомических переменных. Два наиболее распространенных способа включают в себя:
1. Z-тест одной пропорции
Z-тест одной пропорции определяет, равна ли некоторая наблюдаемая пропорция теоретической.
Например, мы можем использовать этот тест, чтобы определить, равна ли истинная доля спортсменов-мужчин в некоторой популяции 50%.
2. Точечно-двурядная корреляция
Точечная бисериальная корреляция используется для измерения отношения между дихотомической переменной и непрерывной переменной.
Этот тип корреляции принимает значение от -1 до 1, где:
- -1 указывает на совершенно отрицательную корреляцию между двумя переменными
- 0 указывает на отсутствие корреляции между двумя переменными
- 1 указывает на совершенно положительную корреляцию между двумя переменными
Например, мы можем рассчитать двухрядную корреляцию между полом и средним количеством очков за игру, чтобы понять, насколько сильно связаны эти две переменные.