Дисперсия выборки и дисперсия населения: в чем разница?

Дисперсия выборки и дисперсия населения: в чем разница?

Дисперсия — это способ измерения разброса значений в наборе данных.

Формула для расчета дисперсии населения :

σ 2 = Σ (xi – μ) 2 / N

куда:

  • Σ : символ, означающий «сумма».
  • μ : Среднее значение населения
  • x i : i -й элемент из совокупности
  • N : Численность населения

Формула для расчета выборочной дисперсии :

s 2 = Σ (x i – x ) 2 / (n-1)

куда:

  • x : выборочное среднее
  • x i : i -й элемент из выборки
  • n : размер выборки

Обратите внимание, что между двумя формулами есть только одна крошечная разница:

Когда мы вычисляем дисперсию населения, мы делим на N (размер населения).

Когда мы вычисляем выборочную дисперсию, мы делим на n-1 (размер выборки — 1).

При расчете выборочной дисперсии мы применяем так называемую поправку Бесселя, которая представляет собой действие деления на n-1.

Не вдаваясь в математические детали, можно показать, что деление на n-1 дает объективную оценку дисперсии генеральной совокупности, которая в любом случае представляет собой значение, которое нас обычно интересует.

Когда рассчитывать дисперсию выборки по сравнению с дисперсией генеральной совокупности

Если вы не уверены, следует ли вам рассчитывать дисперсию выборки или дисперсию генеральной совокупности, помните об этом эмпирическом правиле:

Вы должны рассчитать выборочную дисперсию , когда набор данных, с которым вы работаете, представляет собой выборку, взятую из большей интересующей совокупности.

Вы должны вычислить дисперсию совокупности , когда набор данных, с которым вы работаете, представляет всю совокупность, то есть каждое значение, которое вас интересует.

В следующих примерах показаны различные сценарии расчета выборочной дисперсии по сравнению с дисперсией генеральной совокупности.

Пример: расчет выборочной дисперсии

Предположим, ботаник хочет рассчитать разницу в высоте определенного вида растений. Поскольку в одном регионе растут тысячи отдельных растений, она решает взять простую случайную выборку из 20 растений и измерить высоту каждого из них.

В этом сценарии ботаник должен вычислить дисперсию выборки , потому что он заинтересован в дисперсии всей популяции растений, но просто использует эту выборку для оценки истинной дисперсии популяции.

Пример: расчет дисперсии населения

Предположим, учитель хочет рассчитать дисперсию экзаменационных баллов для 20 учеников в ее классе.

В этом сценарии учитель должен вычислить дисперсию генеральной совокупности , поскольку набор данных, с которым она работает (20 баллов за экзамен), представляет всю интересующую ее совокупность.

Дополнительные ресурсы

В следующих руководствах объясняется, как рассчитать выборочную дисперсию и дисперсию генеральной совокупности в различных статистических программах:

Как рассчитать выборку и дисперсию населения в Excel
Как рассчитать выборку и дисперсию населения в R
Как рассчитать выборку и дисперсию населения в Python

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.