Дисперсия — это способ измерения разброса значений в наборе данных.
Формула для расчета дисперсии населения :
σ 2 = Σ (xi – μ) 2 / N
куда:
- Σ : символ, означающий «сумма».
- μ : Среднее значение населения
- x i : i -й элемент из совокупности
- N : Численность населения
Формула для расчета выборочной дисперсии :
s 2 = Σ (x i – x ) 2 / (n-1)
куда:
- x : выборочное среднее
- x i : i -й элемент из выборки
- n : размер выборки
Обратите внимание, что между двумя формулами есть только одна крошечная разница:
Когда мы вычисляем дисперсию населения, мы делим на N (размер населения).
Когда мы вычисляем выборочную дисперсию, мы делим на n-1 (размер выборки — 1).
При расчете выборочной дисперсии мы применяем так называемую поправку Бесселя, которая представляет собой действие деления на n-1.
Не вдаваясь в математические детали, можно показать, что деление на n-1 дает объективную оценку дисперсии генеральной совокупности, которая в любом случае представляет собой значение, которое нас обычно интересует.
Когда рассчитывать дисперсию выборки по сравнению с дисперсией генеральной совокупности
Если вы не уверены, следует ли вам рассчитывать дисперсию выборки или дисперсию генеральной совокупности, помните об этом эмпирическом правиле:
Вы должны рассчитать выборочную дисперсию , когда набор данных, с которым вы работаете, представляет собой выборку, взятую из большей интересующей совокупности.
Вы должны вычислить дисперсию совокупности , когда набор данных, с которым вы работаете, представляет всю совокупность, то есть каждое значение, которое вас интересует.
В следующих примерах показаны различные сценарии расчета выборочной дисперсии по сравнению с дисперсией генеральной совокупности.
Пример: расчет выборочной дисперсии
Предположим, ботаник хочет рассчитать разницу в высоте определенного вида растений. Поскольку в одном регионе растут тысячи отдельных растений, она решает взять простую случайную выборку из 20 растений и измерить высоту каждого из них.
В этом сценарии ботаник должен вычислить дисперсию выборки , потому что он заинтересован в дисперсии всей популяции растений, но просто использует эту выборку для оценки истинной дисперсии популяции.
Пример: расчет дисперсии населения
Предположим, учитель хочет рассчитать дисперсию экзаменационных баллов для 20 учеников в ее классе.
В этом сценарии учитель должен вычислить дисперсию генеральной совокупности , поскольку набор данных, с которым она работает (20 баллов за экзамен), представляет всю интересующую ее совокупность.
Дополнительные ресурсы
В следующих руководствах объясняется, как рассчитать выборочную дисперсию и дисперсию генеральной совокупности в различных статистических программах:
Как рассчитать выборку и дисперсию населения в Excel
Как рассчитать выборку и дисперсию населения в R
Как рассчитать выборку и дисперсию населения в Python