Условия большой выборки: определение и пример


В статистике нам часто бывает интересно использоватьвыборки, чтобы делать выводы о популяциях с помощью проверок гипотез илидоверительных интервалов .

Большинство формул, которые мы используем в тестах гипотез и доверительных интервалах, исходят из предположения, что данная выборка примерно соответствует нормальному распределению .

Однако, чтобы безопасно сделать это предположение, нам нужно убедиться, что размер нашей выборки достаточно велик. В частности, нам нужно убедиться, что выполняется условие большой выборки .

Условия большой выборки: размер выборки не менее 30.

Примечание. В некоторых учебниках «достаточно большой» размер выборки определяется как минимум 40, но чаще используется число 30.

Когда это условие выполняется, можно предположить, что выборочное распределение среднего значения выборки является приблизительно нормальным. Это предположение позволяет нам использовать выборки, чтобы делать выводы о популяциях, из которых они произошли.

Причина, по которой используется число 30, основана на центральной предельной теореме. Вы можете прочитать больше об этом в этом сообщении в блоге .

Пример: проверка состояния большой выборки

Предположим, некая машина создает крекеры. Распределение веса этих печенек смещено вправо со средним значением 10 унций и стандартным отклонением 2 унции. Если мы возьмем простую случайную выборку из 100 печений, произведенных этой машиной, какова вероятность того, что средний вес печенья в этой выборке будет меньше 9,8 унций?

Чтобы ответить на этот вопрос, мы можем использовать Калькулятор нормального CDF , но сначала нам нужно убедиться, что размер выборки достаточно велик, чтобы предположить, что распределение среднего значения выборки является нормальным.

В этом примере размер нашей выборки равен n = 100 , что намного больше, чем 30. Несмотря на то, что истинное распределение веса файлов cookie смещено вправо, поскольку размер нашей выборки «достаточно велик», мы можем предположить что распределение выборочного среднего является нормальным. Таким образом, мы могли бы безопасно использовать Калькулятор нормального CDF для решения этой проблемы.

Модификации условия большой выборки

Часто размер выборки считается «достаточно большим», если он больше или равен 30, но это число может немного варьироваться в зависимости от основной формы распределения населения.

Особенно:

  • Если распределение населения симметрично, иногда достаточно размера выборки всего 15 человек.
  • Если распределение населения асимметрично, обычно требуется размер выборки не менее 30 человек.
  • Если распределение населения крайне асимметрично, может потребоваться размер выборки 40 или более человек.

В зависимости от формы распределения населения вам может потребоваться размер выборки больше или меньше 30, чтобы применить центральную предельную теорему.

Дополнительные ресурсы

Введение в центральную предельную теорему
Введение в выборочные распределения

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.