Двумя наиболее часто используемыми процедурами в статистике являются проверки гипотез и доверительные интервалы .
Вот разница между ними:
- Тест гипотезы — это формальный статистический тест, который используется для определения того, верна ли какая-либо гипотеза о параметре совокупности.
- Доверительный интервал — это диапазон значений, который может содержать параметр генеральной совокупности с определенным уровнем достоверности.
В этом руководстве представлен краткий обзор каждого метода, а также их сходства и различия.
Основы проверки гипотез
Проверка гипотезы используется для проверки того, верна ли какая-либо гипотеза о параметре совокупности .
Чтобы выполнить проверку гипотезы в реальном мире, исследователи получат случайную выборку из населения и проведут проверку гипотезы на выборочных данных, используя нулевую и альтернативную гипотезы:
- Нулевая гипотеза (H 0 ): Выборка данных происходит чисто случайно.
- Альтернативная гипотеза ( HA ): на выборочные данные повлияла какая-то неслучайная причина.
Если p-значение проверки гипотезы меньше некоторого уровня значимости (например, α = 0,05), то мы можем отклонить нулевую гипотезу и сделать вывод, что у нас есть достаточно доказательств, чтобы сказать, что альтернативная гипотеза верна.
Пример проверки гипотезы
Предположим, производственное предприятие хочет проверить, меняет ли какой-либо новый метод количество бракованных изделий, производимых в месяц, которое в настоящее время составляет 250.
Чтобы проверить это, они могут измерить среднее количество дефектных изделий, произведенных до и после использования нового метода в течение одного месяца.
Они могут выполнить проверку гипотезы, используя следующие гипотезы:
- H 0 : µ после = µ до (среднее количество бракованных изделий одинаково до и после использования нового метода)
- H A : μ после ≠ μ до (среднее количество произведенных дефектных изделий отличается до и после использования нового метода)
Предположим, они выполняют одновыборочный t-критерий и получают p-значение 0,0032.
Поскольку это p-значение меньше, чем α = 0,05, предприятие может отклонить нулевую гипотезу и сделать вывод, что новый метод приводит к изменению количества бракованных изделий, производимых в месяц.
Основы доверительных интервалов
Доверительный интервал — это диапазон значений, который может содержать параметр генеральной совокупности с определенным уровнем достоверности.
Чтобы рассчитать доверительный интервал в реальном мире, исследователи получают случайную выборку из населения и используют следующую формулу для расчета доверительного интервала для среднего значения населения:
Доверительный интервал = x +/- z*(s/ √n )
куда:
- x : выборочное среднее
- z: выбранное значение z
- s: стандартное отклонение выборки
- n: размер выборки
Z-значение, которое вы будете использовать, зависит от выбранного вами уровня достоверности. В следующей таблице показано значение z, которое соответствует популярным вариантам выбора уровня достоверности:
| Уровень достоверности | z-значение | | --- | --- | | 0,90 | 1,645 | | 0,95 | 1,96 | | 0,99 | 2,58 |
Пример доверительного интервала
Предположим, биолог хочет оценить средний вес черепах в определенной популяции, поэтому он собирает случайную выборку черепах со следующей информацией:
- Размер выборки n = 25
- Средний вес выборки x = 300
- Стандартное отклонение выборки s = 18,5
Вот как найти вычислить 90% доверительный интервал для истинного среднего веса населения:
90% доверительный интервал: 300 +/- 1,645*(18,5/√25) = [293,91, 306,09]
Биолог может быть на 90% уверен, что истинный средний вес черепахи в этой популяции составляет от 293,1 до 306,09 фунтов.
Тест гипотезы против доверительного интервала: когда использовать каждый
Решение об использовании теста гипотезы или доверительного интервала зависит от вопроса, на который вы пытаетесь ответить.
Вы должны использовать доверительный интервал , когда хотите оценить значение параметра совокупности.
Вы должны использовать проверку гипотез, когда хотите определить, верна ли какая-либо гипотеза о параметре генеральной совокупности.
Чтобы проверить свои знания о том, когда использовать каждую процедуру, рассмотрите следующие сценарии.
Сценарий 1: Часы, потраченные на учебу
Предположим, академический исследователь хочет измерить среднее количество часов, которое студенты колледжа тратят на учебу в неделю.
Какую процедуру она должна использовать, чтобы ответить на этот вопрос?
Ей следует использовать доверительный интервал , поскольку она заинтересована в оценке значения параметра генеральной совокупности.
Сценарий 2: Новое лекарство
Предположим, врач хочет проверить, способно ли новое лекарство снизить кровяное давление в большей степени, чем текущее стандартное лекарство.
Какую процедуру он должен использовать, чтобы ответить на этот вопрос?
Ему следует использовать проверку гипотезы, потому что он заинтересован в том, чтобы понять, верно ли конкретное предположение о параметре генеральной совокупности.
Дополнительные ресурсы
В следующих руководствах представлена дополнительная информация о проверках гипотез :
Введение в проверку гипотез
Введение в одновыборочный t-критерий
Введение в двухвыборочный t-критерий
Введение в t-критерий парных выборок
В следующих руководствах представлена дополнительная информация о доверительных интервалах :
Введение в доверительные интервалы
Доверительный интервал для среднего
Доверительный интервал для пропорции