Два термина, которые студенты часто путают в статистике, — это стандартная ошибка и погрешность .
Стандартная ошибка измеряет точность оценки среднего значения генеральной совокупности. Он рассчитывается как:
Стандартная ошибка = с / √n
куда:
- s: Стандартное отклонение выборки
- n: размер выборки
Погрешность измеряет полуширину доверительного интервала для среднего значения генеральной совокупности.Он рассчитывается как:
Погрешность = z*(s/√n)
куда:
- z: значение Z, соответствующее заданному уровню достоверности
- s: Стандартное отклонение выборки
- n: размер выборки
Давайте рассмотрим пример, иллюстрирующий эту идею.
Пример: допустимая погрешность и стандартная ошибка
Предположим, мы собираем случайную выборку черепах со следующей информацией:
- Размер выборки n = 25
- Средний вес выборки x = 300
- Стандартное отклонение выборки s = 18,5
Теперь предположим, что мы хотим создать 95% доверительный интервал для истинного среднего веса популяции черепах. Формула для расчета этого доверительного интервала выглядит следующим образом:
Доверительный интервал = x +/- z*(s/√n)
куда:
- x : выборочное среднее
- s: Стандартное отклонение выборки
- n: размер выборки
- z: значение Z, соответствующее заданному уровню достоверности
Z-значение, которое вы будете использовать, зависит от выбранного вами уровня достоверности. В следующей таблице показано значение z, которое соответствует популярным вариантам выбора уровня достоверности:
| Уровень достоверности | z-значение | | --- | --- | | 0,90 | 1,645 | | 0,95 | 1,96 | | 0,99 | 2,58 |
Обратите внимание, что более высокие уровни достоверности соответствуют большим значениям z, что приводит к более широким доверительным интервалам. Это означает, что, например, 99-процентный доверительный интервал будет шире, чем 95-процентный доверительный интервал для того же набора данных.
Стандартная ошибка будет рассчитываться как:
Standard error** = s/√n = 18.5/√25 = **3.7
Погрешность будет рассчитываться как
Margin of error** = z\*(s/√n) = 1.96\*(18.5/√25) = **7.25
И 95% доверительный интервал будет рассчитываться как
95% Confidence Interval** = x +/- z\*(s/√n) = 300 +/- 1.96\*(18.5/√25) = **[292.75, 307.25]
Обратите внимание, что ширина всего доверительного интервала составляет 307,25 – 292,75 = 14,5 .
Обратите внимание, что погрешность равна половине этой ширины: 14,5/2 = 7,25 .
Обратите также внимание, что предел погрешности всегда будет больше стандартной ошибки просто потому, что предел погрешности равен стандартной ошибке, умноженной на некоторое критическое значение Z. В предыдущем примере мы умножили стандартную ошибку на 1,96, чтобы получить погрешность.
Дополнительные ресурсы
Что такое доверительные интервалы?
Стандартное отклонение и стандартная ошибка: в чем разница?