Дисперсия выборки и дисперсия населения: в чем разница?


Дисперсия — это способ измерения разброса значений в наборе данных.

Формула для расчета дисперсии населения :

σ 2 = Σ (xi – μ) 2 / N

куда:

  • Σ : символ, означающий «сумма».
  • μ : Среднее значение населения
  • x i : i -й элемент из совокупности
  • N : Численность населения

Формула для расчета выборочной дисперсии :

s 2 = Σ (x i – x ) 2 / (n-1)

куда:

  • x : выборочное среднее
  • x i : i -й элемент из выборки
  • n : размер выборки

Обратите внимание, что между двумя формулами есть только одна крошечная разница:

Когда мы вычисляем дисперсию населения, мы делим на N (размер населения).

Когда мы вычисляем выборочную дисперсию, мы делим на n-1 (размер выборки — 1).

При расчете выборочной дисперсии мы применяем так называемую поправку Бесселя, которая представляет собой действие деления на n-1.

Не вдаваясь в математические детали, можно показать, что деление на n-1 дает объективную оценку дисперсии генеральной совокупности, которая в любом случае представляет собой значение, которое нас обычно интересует.

Когда рассчитывать дисперсию выборки по сравнению с дисперсией генеральной совокупности

Если вы не уверены, следует ли вам рассчитывать дисперсию выборки или дисперсию генеральной совокупности, помните об этом эмпирическом правиле:

Вы должны рассчитать выборочную дисперсию , когда набор данных, с которым вы работаете, представляет собой выборку, взятую из большей интересующей совокупности.

Вы должны вычислить дисперсию совокупности , когда набор данных, с которым вы работаете, представляет всю совокупность, то есть каждое значение, которое вас интересует.

В следующих примерах показаны различные сценарии расчета выборочной дисперсии по сравнению с дисперсией генеральной совокупности.

Пример: расчет выборочной дисперсии

Предположим, ботаник хочет рассчитать разницу в высоте определенного вида растений. Поскольку в одном регионе растут тысячи отдельных растений, она решает взять простую случайную выборку из 20 растений и измерить высоту каждого из них.

В этом сценарии ботаник должен вычислить дисперсию выборки , потому что он заинтересован в дисперсии всей популяции растений, но просто использует эту выборку для оценки истинной дисперсии популяции.

Пример: расчет дисперсии населения

Предположим, учитель хочет рассчитать дисперсию экзаменационных баллов для 20 учеников в ее классе.

В этом сценарии учитель должен вычислить дисперсию генеральной совокупности , поскольку набор данных, с которым она работает (20 баллов за экзамен), представляет всю интересующую ее совокупность.

Дополнительные ресурсы

В следующих руководствах объясняется, как рассчитать выборочную дисперсию и дисперсию генеральной совокупности в различных статистических программах:

Как рассчитать выборку и дисперсию населения в Excel
Как рассчитать выборку и дисперсию населения в R
Как рассчитать выборку и дисперсию населения в Python