Что такое выборочное распределение?

Что такое выборочное распределение?

Представьте, что существует популяция из 10 000 дельфинов, и средний вес дельфина в этой популяции составляет 300 фунтов.

Если мы возьмем простую случайную выборку из 50 дельфинов из этой популяции, мы можем обнаружить, что средний вес дельфинов в этой выборке составляет 305 фунтов.

Затем, если мы возьмем еще одну простую случайную выборку из 50 дельфинов, мы можем обнаружить, что средний вес дельфинов в этой выборке составляет 295 фунтов.

Каждый раз, когда мы берем простую случайную выборку из 50 дельфинов, вполне вероятно, что средний вес дельфинов в выборке будет близок к среднему значению популяции в 300 фунтов, но не точно 300 фунтам.

Представьте, что мы берем 200 простых случайных выборок из 50 дельфинов из этой популяции и строим гистограмму среднего веса в каждой выборке:

В большинстве образцов средний вес будет близок к 300 фунтам. В редких случаях может случиться так, что мы выберем образец, полный маленьких дельфинов, средний вес которых составляет всего 250 фунтов. Или мы можем случайно выбрать образец, полный крупных дельфинов, средний вес которых составляет 350 фунтов. В целом распределение выборочных средних будет приблизительно нормальным, а центр распределения будет находиться в истинном центре генеральной совокупности.

Это распределение выборочных средних известно как выборочное распределение среднего и обладает следующими свойствами:

м х = м

где μx — выборочное среднее, а μ — среднее значение генеральной совокупности.

σ х = σ/ √n

где σ x — стандартное отклонение выборки, σ — стандартное отклонение генеральной совокупности, а n — размер выборки.

Например, в этой популяции дельфинов мы знаем, что средний вес равен μ = 300. Таким образом, среднее значение выборочного распределения равно μ x = 300 .

Предположим, мы также знаем, что стандартное отклонение населения составляет 18 фунтов. Таким образом, стандартное отклонение выборки равно σ x = 18/√50 = 2,546 .

Выборочное распределение доли

Рассмотрим ту же популяцию из 10 000 дельфинов. Предположим, что 10% дельфинов черные, а остальные серые. Предположим, мы берем простую случайную выборку из 50 дельфинов и обнаруживаем, что 14% дельфинов в этой выборке — черные. Затем мы берем еще одну простую случайную выборку из 50 дельфинов и обнаруживаем, что 8% дельфинов в этой выборке черные.

Представьте, что мы берем 200 простых случайных выборок из 50 дельфинов из этой популяции и строим гистограмму доли черных дельфинов в каждой выборке:

В большинстве выборок доля черных дельфинов будет близка к истинной популяции в 10%. Распределение выборочной доли черных дельфинов будет приблизительно нормальным, а центр распределения будет находиться в истинном центре популяции.

Это распределение выборочных долей известно как выборочное распределение доли и обладает следующими свойствами:

μ р = P

где p — доля выборки, а P — доля совокупности.

σ p = √ (P) (1-P) / n

где P — доля населения, а n — размер выборки.

Например, в этой популяции дельфинов мы знаем, что истинная доля черных дельфинов составляет 10% = 0,1. Таким образом, среднее значение выборочного распределения доли составляет μ p = 0,1 .

Предположим, мы также знаем, что стандартное отклонение населения составляет 18 фунтов. Таким образом, стандартное отклонение выборки равно σ p = √ (P)(1-P) / n = √ (0,1)(1-0,1) / 50 = 0,042 .

Установление нормальности

Чтобы использовать приведенные выше формулы, распределение выборки должно быть нормальным.

Согласно центральной предельной теореме , выборочное распределение среднего значения выборки приблизительно нормально, если размер выборки достаточно велик, даже если распределение генеральной совокупности не является нормальным.В большинстве случаев мы считаем, что размер выборки в 30 или более человек является достаточно большим.

Выборочное распределение доли выборки является приблизительно нормальным, если ожидаемое количество успешных и неудачных попыток равно как минимум 10.

Примеры

Мы можем использовать выборочные распределения для расчета вероятностей.

Пример 1: Определенная машина создает файлы cookie. Распределение веса этих печенек смещено вправо со средним значением 10 унций и стандартным отклонением 2 унции. Если мы возьмем простую случайную выборку из 100 печений, произведенных этой машиной, какова вероятность того, что средний вес печенья в этой выборке будет меньше 9,8 унций?

Шаг 1: Установите нормальность.

Нам нужно убедиться, что выборочное распределение среднего значения выборки является нормальным. Поскольку размер нашей выборки больше или равен 30, в соответствии с центральной предельной теоремой мы можем предположить, что выборочное распределение выборочного среднего является нормальным.

Шаг 2: Найдите среднее значение и стандартное отклонение выборочного распределения.

м х = м

σ х = σ/ √n

мкх = 10 унций

σ x = 2/√100 = 2/10 = 0,2 унции

Шаг 3: Используйте калькулятор площади Z Score, чтобы найти вероятность того, что средний вес печенья в этом образце меньше 9,8 унций.

Введите следующие числа в Калькулятор площади Z Score.Вы можете оставить «Исходный балл 2» пустым, так как в этом примере мы находим только одно число.


Поскольку мы хотим узнать вероятность того, что средний вес печенья в этой выборке меньше 9,8 унций, нас интересует площадь слева от 9,8. Калькулятор говорит нам, что эта вероятность равна 0,15866 .

Пример 2. Согласно общешкольному исследованию, 87% учащихся в определенной школе предпочитают пиццу мороженому. Предположим, мы берем простую случайную выборку из 200 студентов. Какова вероятность того, что доля студентов, предпочитающих пиццу, меньше 85 %?

Шаг 1: Установите нормальность.

Напомним, что выборочное распределение доли выборки является приблизительно нормальным, если ожидаемое количество «успехов» и «неуспехов» равно как минимум 10.

В этом случае ожидаемое количество студентов, которые предпочтут пиццу, составляет 87% * 200 студентов = 174 студента. Ожидаемое количество студентов, которые не предпочтут пиццу, составляет 13% * 200 студентов = 26 студентов. Поскольку оба эти числа не меньше 10, можно предположить, что выборочное распределение выборочной доли студентов, предпочитающих пиццу, примерно нормальное.

Шаг 2: Найдите среднее значение и стандартное отклонение выборочного распределения.

μ р = P

σ p = √ (P) (1-P) / n

мк р = 0,87

σ p = √ (0,87) (1–0,87) / 200 = 0,024

Шаг 3: Используйте Калькулятор Z Score Area Calculator , чтобы определить вероятность того, что доля учащихся, предпочитающих пиццу, составляет менее 85 %.

Введите следующие числа в Калькулятор площади Z Score.Вы можете оставить «Исходный балл 2» пустым, так как в этом примере мы находим только одно число.

Поскольку мы хотим узнать вероятность того, что доля студентов, предпочитающих пиццу, составляет менее 85 %, нас интересует область слева от 0,85. Калькулятор говорит нам, что эта вероятность равна 0,20233 .

Бонус: видео-объяснение распределений выборки

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.