В статистике есть два разных типа тестов хи-квадрат:
1.Хи-квадрат критерия согласия — используется для определения того, следует ли категориальная переменная гипотетическому распределению.
2.Критерий независимости хи-квадрат — используется для определения наличия значимой связи между двумя категориальными переменными.
В этой статье мы поделимся несколькими примерами того, как каждый из этих типов тестов хи-квадрат используется в реальных жизненных ситуациях.
Пример 1. Хи-квадрат критерия согласия
Предположим, владелец магазина утверждает, что каждый будний день в его магазин заходит одинаковое количество покупателей.
Чтобы проверить эту гипотезу, он записывает количество покупателей, которые приходят в магазин на данной неделе, и находит следующее:
- Понедельник: 50 клиентов
- вторник: 60 клиентов
- Среда: 40 клиентов
- Четверг: 47 клиентов
- Пятница: 53 клиента
Он может использовать критерий согласия Хи-квадрат соответствия, чтобы определить, согласуется ли распределение клиентов, которые приходят каждый день, с его гипотетическим распределением.
Используя Калькулятор критерия согласия хи-квадрат , он может найти, что p-значение теста равно 0,359 .


Поскольку это p-значение не меньше 0,05, нет достаточных оснований утверждать, что истинное распределение покупателей отличается от распределения, о котором заявил владелец магазина.
Пример 2. Хи-квадрат критерия согласия
Предположим, биолог утверждает, что равное количество четырех различных видов оленей каждую неделю заходит в определенный лесной массив в лесу.
Чтобы проверить эту гипотезу, она записывает количество каждого вида оленей, которые входят в лесную зону в течение одной недели:
- Вид №1: 22
- Вид № 2: 20
- Вид №3: 23
- Вид №4: 35
Она может использовать критерий согласия Хи-квадрат соответствия, чтобы определить, соответствует ли распределение видов оленей, которые еженедельно заходят в лесную зону в лесу, его предполагаемому распределению.
Используя Калькулятор критерия согласия хи-квадрат , она может найти, что p-значение теста равно 0,137 .


Поскольку это p-значение не меньше 0,05, нет достаточных доказательств того, что истинное распределение оленей отличается от распределения, о котором заявил биолог.
Пример 3: критерий независимости хи-квадрат
Предположим, политик в каком-то городе хочет знать, связан ли гендер с предпочтениями политической партии.
Он решает взять простую случайную выборку из 500 избирателей и опросить их на предмет предпочтения их политических партий. В следующей таблице представлены результаты опроса:
| | | | | | | --- | --- | --- | --- | --- | | | республиканец | демократ | Независимый | Общий | | Мужской | 120 | 90 | 40 | 250 | | женский | 110 | 95 | 45 | 250 | | Общий | 230 | 185 | 85 | 500 |
Он может использовать критерий независимости Хи-квадрат, чтобы определить, существует ли статистически значимая связь между двумя переменными.
Используя Калькулятор критерия независимости хи-квадрат , он может найти, что p-значение теста равно 0,649 .

Поскольку p-значение не меньше 0,05, нет достаточных доказательств того, что существует связь между полом и предпочтениями политической партии.
Пример 4: критерий независимости хи-квадрат
Предположим, исследователь хочет знать, связано ли семейное положение с уровнем образования.
Он решает взять простую случайную выборку из 300 человек и получает следующие результаты:
| | | | | | | --- | --- | --- | --- | --- | | | Средняя школа | Бакалавриат | Магистр или выше | Общий | | Женатый | 20 | 100 | 35 | 155 | | Одинокий | 50 | 80 | 15 | 145 | | Общий | 70 | 180 | 50 | 300 |
Он может использовать критерий независимости Хи-квадрат, чтобы определить, существует ли статистически значимая связь между двумя переменными.
Используя Калькулятор критерия независимости хи-квадрат , он может найти, что p-значение теста равно 0,000011 .

Поскольку p-значение меньше 0,05, имеется достаточно доказательств, чтобы сказать, что существует связь между семейным положением и уровнем образования.
Дополнительные ресурсы
В следующих учебных пособиях представлено введение в различные типы тестов хи-квадрат:
В следующих руководствах объясняется разница между тестами хи-квадрат и другими статистическими тестами: