Почему размер выборки важен? (Объяснение и примеры)

Почему размер выборки важен? (Объяснение и примеры)

Размер выборки относится к общему числу лиц, участвующих в эксперименте или исследовании.

Размер выборки важен, потому что он напрямую влияет на то, насколько точно мы можем оценить параметры совокупности.

Чтобы понять, почему это так, полезно иметь общее представление о доверительных интервалах.

Краткое объяснение доверительных интервалов

В статистике нас часто интересует измерение параметров населения — чисел, описывающих некоторые характеристики всего населения.

Например, нас может заинтересовать измерение среднего роста всех людей в определенном городе.

Однако сбор данных о каждом человеке в популяции часто требует слишком больших затрат и времени, поэтому вместо этого мы обычно берем случайную выборку из популяции и используем данные из выборки для оценки параметра популяции.

Например, мы можем собрать данные о росте 100 случайных жителей города. Затем мы можем рассчитать средний рост людей в выборке. Однако мы не можем быть уверены, что среднее значение выборки точно соответствует среднему значению генеральной совокупности.

Чтобы учесть эту неопределенность, мы можем создать доверительный интервал.Доверительный интервал — это диапазон значений, который может содержать параметр генеральной совокупности с определенным уровнем достоверности.

Формула для расчета доверительного интервала для среднего значения генеральной совокупности:

Доверительный интервал = x +/- z*(s/ √n )

куда:

  • x : выборочное среднее
  • z: выбранное значение z
  • s: стандартное отклонение выборки
  • n: размер выборки

Z-значение, которое вы будете использовать, зависит от выбранного вами уровня достоверности. В следующей таблице показано значение z, которое соответствует популярным вариантам выбора уровня достоверности:

| Уровень достоверности | z-значение | | --- | --- | | 0,90 | 1,645 | | 0,95 | 1,96 | | 0,99 | 2,58 |

Взаимосвязь между размером выборки и доверительными интервалами

Предположим, мы хотим оценить средний вес популяции черепах. Мы собираем случайную выборку черепах со следующей информацией:

  • Размер выборки n = 25
  • Средний вес выборки x = 300
  • Стандартное отклонение выборки s = 18,5

Вот как найти вычислить 90% доверительный интервал для истинного среднего веса населения:

90% доверительный интервал: 300 +/- 1,645*(18,5/√ 25 ) = [293,91, 306,09]

Мы на 90% уверены, что истинный средний вес черепах в популяции составляет от 293,91 до 306,09 фунтов.

Теперь предположим, что вместо 25 черепах мы фактически собираем данные о 50 черепахах.

Вот как найти вычислить 90% доверительный интервал для истинного среднего веса населения:

90% доверительный интервал: 300 +/- 1,645*(18,5/ √50 ) = [295,79, 304,30]

Обратите внимание, что этот доверительный интервал уже, чем предыдущий доверительный интервал. Это означает, что наша оценка истинного среднего веса популяции черепах является более точной.

Теперь предположим, что вместо этого мы собрали данные для 100 черепах.

Вот как найти вычислить 90% доверительный интервал для истинного среднего веса населения:

90% доверительный интервал: 300 +/- 1,645*(18,5/√ 100 ) = [296,96, 303,04]

Обратите внимание, что этот доверительный интервал еще уже , чем предыдущий доверительный интервал.

В следующей таблице приведены все значения ширины доверительного интервала:

Вот вывод: чем больше размер выборки, тем точнее мы можем оценить параметр генеральной совокупности .

Дополнительные ресурсы

Следующие руководства содержат другие полезные объяснения доверительных интервалов и размера выборки.

Введение в доверительные интервалы
4 примера доверительных интервалов в реальной жизни
Население и выборка: в чем разница?

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.