Введение в проверку гипотез


Статистическая гипотеза – это предположение о параметре совокупности .

Например, мы можем предположить, что средний рост мужчины в США составляет 70 дюймов.

Предположение о росте является статистической гипотезой , а истинный средний рост мужчины в США является популяционным параметром .

Проверка гипотезы — это формальный статистический тест, который мы используем, чтобы отвергнуть или не опровергнуть статистическую гипотезу.

Два типа статистических гипотез

Чтобы проверить, верна ли статистическая гипотеза о параметре совокупности, мы получаем случайную выборку из совокупности и выполняем проверку гипотезы на выборочных данных.

Существует два типа статистических гипотез:

Нулевая гипотеза , обозначаемая как H 0 , представляет собой гипотезу о том, что выборка данных происходит чисто случайно.

Альтернативная гипотеза , обозначаемая как H 1 или H a , представляет собой гипотезу о том, что на выборочные данные влияет какая-то неслучайная причина.

Проверка гипотез

Проверка гипотезы состоит из пяти шагов:

1. Сформулируйте гипотезы.

Сформулируйте нулевую и альтернативную гипотезы. Эти две гипотезы должны быть взаимоисключающими, поэтому, если одна верна, другая должна быть ложной.

2. Определите уровень значимости для гипотезы.

Определите уровень значимости. Распространенные варианты: .01, .05 и .1.

3. Найдите тестовую статистику.

Найдите тестовую статистику и соответствующее значение p. Часто мы анализируем среднее значение или долю населения, и общая формула для нахождения тестовой статистики выглядит следующим образом: (выборочная статистика — параметр совокупности) / (стандартное отклонение статистики)

4. Отклонить или не отклонить нулевую гипотезу.

Используя тестовую статистику или p-значение, определите, можете ли вы отклонить или не отклонить нулевую гипотезу на основе уровня значимости.

Значение p говорит нам о силе доказательств в поддержку нулевой гипотезы. Если p-значение меньше уровня значимости, мы отклоняем нулевую гипотезу.

5. Интерпретируйте результаты.

Интерпретируйте результаты проверки гипотезы в контексте заданного вопроса.

Два типа ошибок принятия решений

Есть два типа ошибок принятия решений, которые можно сделать при проверке гипотезы:

Ошибка I типа: вы отвергаете нулевую гипотезу, когда она на самом деле верна. Вероятность совершения ошибки первого рода равна уровню значимости, часто называемому альфа и обозначаемому как α.

Ошибка типа II: вы не можете отвергнуть нулевую гипотезу, когда она на самом деле ложна. Вероятность совершения ошибки типа II называется мощностью теста или бета и обозначается как β.

Односторонний и двусторонний тесты

Статистическая гипотеза может быть односторонней или двусторонней.

Односторонняя гипотеза предполагает утверждение «больше» или «меньше».

Например, предположим, что средний рост мужчины в США больше или равен 70 дюймам. Нулевой гипотезой будет H0: µ ≥ 70 дюймов, а альтернативной гипотезой будет Ha: µ < 70 дюймов.

Двусторонняя гипотеза предполагает утверждение «равно» или «не равно».

Например, предположим, что мы предполагаем, что средний рост мужчины в США равен 70 дюймам. Нулевой гипотезой будет H0: µ = 70 дюймов, а альтернативной гипотезой будет Ha: µ ≠ 70 дюймов.

Примечание. Знак «равно» всегда включается в нулевую гипотезу, будь то =, ≥ или ≤.

По теме: Что такое гипотеза направления?

Типы проверки гипотез

Существует множество различных типов проверки гипотез, которые вы можете выполнять в зависимости от типа данных, с которыми вы работаете, и цели вашего анализа.

Следующие руководства содержат объяснение наиболее распространенных типов проверки гипотез:

Введение в одновыборочный t-критерий
Введение в двухвыборочный t-критерий
Введение в t-критерий парных выборок
Введение в Z-тест одной пропорции
Введение в двухпропорционный Z-тест