Проверка гипотезы и доверительный интервал: в чем разница?


Двумя наиболее часто используемыми процедурами в статистике являются проверки гипотез и доверительные интервалы .

Вот разница между ними:

  • Тест гипотезы — это формальный статистический тест, который используется для определения того, верна ли какая-либо гипотеза о параметре совокупности.
  • Доверительный интервал — это диапазон значений, который может содержать параметр генеральной совокупности с определенным уровнем достоверности.

В этом руководстве представлен краткий обзор каждого метода, а также их сходства и различия.

Основы проверки гипотез

Проверка гипотезы используется для проверки того, верна ли какая-либо гипотеза о параметре совокупности .

Чтобы выполнить проверку гипотезы в реальном мире, исследователи получат случайную выборку из населения и проведут проверку гипотезы на выборочных данных, используя нулевую и альтернативную гипотезы:

  • Нулевая гипотеза (H 0 ): Выборка данных происходит чисто случайно.
  • Альтернативная гипотеза ( HA ): на выборочные данные повлияла какая-то неслучайная причина.

Если p-значение проверки гипотезы меньше некоторого уровня значимости (например, α = 0,05), то мы можем отклонить нулевую гипотезу и сделать вывод, что у нас есть достаточно доказательств, чтобы сказать, что альтернативная гипотеза верна.

Пример проверки гипотезы

Предположим, производственное предприятие хочет проверить, меняет ли какой-либо новый метод количество бракованных изделий, производимых в месяц, которое в настоящее время составляет 250.

Чтобы проверить это, они могут измерить среднее количество дефектных изделий, произведенных до и после использования нового метода в течение одного месяца.

Они могут выполнить проверку гипотезы, используя следующие гипотезы:

  • H 0 : µ после = µ до (среднее количество бракованных изделий одинаково до и после использования нового метода)
  • H A : μ после ≠ μ до (среднее количество произведенных дефектных изделий отличается до и после использования нового метода)

Предположим, они выполняют одновыборочный t-критерий и получают p-значение 0,0032.

Поскольку это p-значение меньше, чем α = 0,05, предприятие может отклонить нулевую гипотезу и сделать вывод, что новый метод приводит к изменению количества бракованных изделий, производимых в месяц.

Основы доверительных интервалов

Доверительный интервал — это диапазон значений, который может содержать параметр генеральной совокупности с определенным уровнем достоверности.

Чтобы рассчитать доверительный интервал в реальном мире, исследователи получают случайную выборку из населения и используют следующую формулу для расчета доверительного интервала для среднего значения населения:

Доверительный интервал = x +/- z*(s/ √n )

куда:

  • x : выборочное среднее
  • z: выбранное значение z
  • s: стандартное отклонение выборки
  • n: размер выборки

Z-значение, которое вы будете использовать, зависит от выбранного вами уровня достоверности. В следующей таблице показано значение z, которое соответствует популярным вариантам выбора уровня достоверности:

| Уровень достоверности | z-значение | | --- | --- | | 0,90 | 1,645 | | 0,95 | 1,96 | | 0,99 | 2,58 |

Пример доверительного интервала

Предположим, биолог хочет оценить средний вес черепах в определенной популяции, поэтому он собирает случайную выборку черепах со следующей информацией:

  • Размер выборки n = 25
  • Средний вес выборки x = 300
  • Стандартное отклонение выборки s = 18,5

Вот как найти вычислить 90% доверительный интервал для истинного среднего веса населения:

90% доверительный интервал: 300 +/- 1,645*(18,5/√25) = [293,91, 306,09]

Биолог может быть на 90% уверен, что истинный средний вес черепахи в этой популяции составляет от 293,1 до 306,09 фунтов.

Тест гипотезы против доверительного интервала: когда использовать каждый

Решение об использовании теста гипотезы или доверительного интервала зависит от вопроса, на который вы пытаетесь ответить.

Вы должны использовать доверительный интервал , когда хотите оценить значение параметра совокупности.

Вы должны использовать проверку гипотез, когда хотите определить, верна ли какая-либо гипотеза о параметре генеральной совокупности.

Чтобы проверить свои знания о том, когда использовать каждую процедуру, рассмотрите следующие сценарии.

Сценарий 1: Часы, потраченные на учебу

Предположим, академический исследователь хочет измерить среднее количество часов, которое студенты колледжа тратят на учебу в неделю.

Какую процедуру она должна использовать, чтобы ответить на этот вопрос?

Ей следует использовать доверительный интервал , поскольку она заинтересована в оценке значения параметра генеральной совокупности.

Сценарий 2: Новое лекарство

Предположим, врач хочет проверить, способно ли новое лекарство снизить кровяное давление в большей степени, чем текущее стандартное лекарство.

Какую процедуру он должен использовать, чтобы ответить на этот вопрос?

Ему следует использовать проверку гипотезы, потому что он заинтересован в том, чтобы понять, верно ли конкретное предположение о параметре генеральной совокупности.

Дополнительные ресурсы

В следующих руководствах представлена дополнительная информация о проверках гипотез :

Введение в проверку гипотез
Введение в одновыборочный t-критерий
Введение в двухвыборочный t-критерий
Введение в t-критерий парных выборок

В следующих руководствах представлена дополнительная информация о доверительных интервалах :

Введение в доверительные интервалы
Доверительный интервал для среднего
Доверительный интервал для пропорции

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.