Что такое бета-уровень в статистике? (Определение и пример)


В статистике мы используем проверку гипотез, чтобы определить, верно ли какое-либо предположение о параметре совокупности .

Проверка гипотезы всегда имеет следующие две гипотезы:

Нулевая гипотеза (H 0 ): данные выборки согласуются с преобладающим мнением о параметре совокупности.

Альтернативная гипотеза ( HA ): выборочные данные предполагают, что предположение, сделанное в нулевой гипотезе, неверно. Другими словами, на данные влияет какая-то неслучайная причина.

Всякий раз, когда мы проводим проверку гипотезы, всегда есть четыре возможных результата:

Есть два типа ошибок, которые мы можем совершить:

  • Ошибка первого рода: мы отвергаем нулевую гипотезу, если она действительно верна. Вероятность совершения ошибки такого типа обозначается как α .
  • Ошибка типа II: мы не можем отвергнуть нулевую гипотезу, когда она на самом деле ложна. Вероятность совершения ошибки такого типа обозначается как β .

Отношения между Альфой и Бетой

В идеале исследователи хотят, чтобы как вероятность совершения ошибки первого рода, так и вероятность совершения ошибки второго рода были низкими.

Однако между этими двумя вероятностями существует компромисс. Если мы уменьшим альфа-уровень, мы можем уменьшить вероятность отклонения нулевой гипотезы, когда она на самом деле верна, но на самом деле это увеличивает бета-уровень — вероятность того, что мы не сможем отвергнуть нулевую гипотезу, когда она на самом деле ложна.

Отношения между мощностью и бета

Мощность проверки гипотезы относится к вероятности обнаружения эффекта или различия, когда эффект или различие действительно присутствует. Другими словами, это вероятность правильного отклонения ложной нулевой гипотезы.

Он рассчитывается как:

Мощность = 1 – β

Как правило, исследователи хотят, чтобы мощность теста была высокой, чтобы, если какой-то эффект или различие действительно существует, тест мог их обнаружить.

Из приведенного выше уравнения видно, что лучший способ повысить мощность теста — снизить бета-уровень. И лучший способ уменьшить бета-уровень, как правило, — это увеличить размер выборки.

В следующих примерах показано, как рассчитать бета-уровень проверки гипотезы, и показано, почему увеличение размера выборки может снизить бета-уровень.

Пример 1: расчет бета для проверки гипотезы

Предположим, исследователь хочет проверить, меньше ли средний вес изделий, произведенных на фабрике, 500 унций. Известно, что стандартное отклонение весов составляет 24 унции, и исследователь решает собрать случайную выборку из 40 штук.

Он выполнит следующую гипотезу при α = 0,05:

  • H 0 : μ = 500
  • Н А : мк < 500

Теперь представьте, что средний вес производимых изделий составляет 490 унций. Другими словами, нулевая гипотеза должна быть отвергнута.

Мы можем использовать следующие шаги для расчета бета-уровня — вероятности того, что нулевая гипотеза не будет отвергнута, когда ее действительно следует отвергнуть:

Шаг 1: Найдите неотклоняемую область.

Согласно Калькулятору критического значения Z , левостороннее критическое значение при α = 0,05 составляет -1,645 .

Шаг 2: Найдите минимальное значение выборки, которое мы не сможем отклонить.

Статистика теста рассчитывается как z = ( x - μ) / (s / √ n )

Таким образом, мы можем решить это уравнение для выборочного среднего:

  • х = μ - z * (с / √ п )
  • х = 500 – 1,645*(24/ √40 )
  • х = 493,758

Шаг 3: Найдите вероятность того, что минимальное среднее значение выборки действительно произойдет.

Мы можем рассчитать эту вероятность как:

  • P(Z ≥ (493,758 – 490) / (24/√ 40 ))
  • Р(Z ≥ 0,99)

Согласно калькулятору нормального CDF , вероятность того, что Z ≥ 0,99, составляет 0,1611 .

Таким образом, бета-уровень для этого теста составляет β = 0,1611. Это означает, что существует 16,11%-ная вероятность того, что разница не будет обнаружена, если реальное среднее значение составляет 490 унций.

Пример 2. Вычисление коэффициента бета для теста с большим объемом выборки

Теперь предположим, что исследователь выполняет ту же самую проверку гипотезы, но вместо этого использует размер выборки n = 100 виджетов. Мы можем повторить те же три шага, чтобы рассчитать бета-уровень для этого теста:

Шаг 1: Найдите неотклоняемую область.

Согласно Калькулятору критического значения Z , левостороннее критическое значение при α = 0,05 составляет -1,645 .

Шаг 2: Найдите минимальное значение выборки, которое мы не сможем отклонить.

Статистика теста рассчитывается как z = ( x - μ) / (s / √ n )

Таким образом, мы можем решить это уравнение для выборочного среднего:

  • х = μ - z * (с / √ п )
  • х = 500 – 1,645*(24/ √100 )
  • х = 496,05

Шаг 3: Найдите вероятность того, что минимальное среднее значение выборки действительно произойдет.

Мы можем рассчитать эту вероятность как:

  • P(Z ≥ (496,05 – 490) / (24/√ 100 ))
  • P(Z ≥ 2,52)

Согласно калькулятору нормального CDF , вероятность того, что Z ≥ 2,52, составляет 0,0059.

Таким образом, бета-уровень для этого теста составляет β = 0,0059. Это означает, что вероятность того, что разница не будет обнаружена, составляет всего 0,59%, если реальное среднее значение составляет 490 унций.

Обратите внимание, что просто увеличив размер выборки с 40 до 100, исследователь смог снизить бета-уровень с 0,1611 до 0,0059.

Бонус: используйте этот калькулятор ошибок типа II для автоматического расчета бета-уровня теста.

Дополнительные ресурсы

Введение в проверку гипотез
Как написать нулевую гипотезу (5 примеров)
Объяснение P-значений и статистической значимости