Население и выборка: в чем разница?

Население и выборка: в чем разница?

Часто в статистике мы заинтересованы в сборе данных, чтобы мы могли ответить на какой-то исследовательский вопрос.

Например, мы можем захотеть ответить на следующие вопросы:

1. Каков средний доход домохозяйства в Майами, Флорида?

2. Каков средний вес определенной популяции черепах?

3. Какой процент жителей определенного округа поддерживает определенный закон?

В каждом сценарии нас интересует ответ на некоторый вопрос о совокупности , которая представляет все возможные отдельные элементы, которые мы хотим измерить.

Однако вместо сбора данных о каждом человеке в популяции мы собираем данные по выборке популяции, которая представляет собой часть популяции.

Население : каждый возможный отдельный элемент, который мы хотим измерить.
Образец: Часть населения.

Вот пример совокупности и выборки в трех вводных примерах.

Пример 1: Каков средний доход домохозяйства в Майами, Флорида?

Все население может включать 500 000 домохозяйств, но мы можем собрать данные только по выборке из 2 000 домохозяйств.

Население против выборки

2. Каков средний вес определенной популяции черепах?

Вся популяция может включать 800 черепах, но мы можем собрать данные только по выборке из 30 черепах.

Разница между популяцией и выборкой

3. Какой процент жителей определенного округа поддерживает определенный закон?

Все население может включать 50 000 жителей, но мы можем собрать данные только по выборке из 1 000 жителей.

Пример совокупности и выборки

Зачем использовать образцы?

Есть несколько причин, по которым мы обычно собираем данные по выборкам, а не по всей совокупности, в том числе:

1.Сбор данных по всему населению занимает слишком много времени.Например, если мы хотим узнать средний доход домохозяйства в Майами, штат Флорида, могут потребоваться месяцы или даже годы, чтобы собрать данные о доходах для каждого домохозяйства. К тому времени, когда мы соберем все эти данные, население может измениться или интересующий вопрос исследования может больше не представлять интереса.

2. Слишком дорого собирать данные обо всем населении. Часто слишком дорого обходиться и собирать данные для каждого человека в популяции, поэтому вместо этого мы предпочитаем собирать данные по выборке.

3. Невозможно собрать данные по всему населению. Во многих случаях просто невозможно собрать данные о каждом человеке в популяции. Например, может быть чрезвычайно сложно отследить и взвесить каждую черепаху в определенной интересующей нас популяции.

Собирая данные по образцам, мы можем собирать информацию о данной популяции намного быстрее и дешевле.

И если наша выборка репрезентативна для населения , то мы можем обобщить результаты выборки на большую совокупность с высоким уровнем достоверности.

Важность репрезентативных образцов

Когда мы собираем выборку из населения, в идеале мы хотим, чтобы эта выборка была похожа на «мини-версию» нашей совокупности.

Например, предположим, что мы хотим понять, какие фильмы предпочитают учащиеся в определенном школьном округе, в котором учится 5000 учащихся. Поскольку опрос каждого учащегося в отдельности занял бы слишком много времени, мы могли бы вместо этого взять выборку из 100 учащихся и спросить их об их предпочтениях.

Если все учащиеся состоят из 50% девочек и 50% мальчиков, наша выборка не будет репрезентативной, если она будет включать 90% мальчиков и только 10% девочек.

Репрезентативная выборка населения

Или, если общая популяция состоит из равных частей первокурсников, второкурсников, младших и старших классов, тогда наша выборка не будет репрезентативной, если она будет включать только первокурсников.

Выборка является репрезентативной для совокупности, если характеристики лиц в выборке близко соответствуют характеристикам лиц в общей совокупности.

Когда это происходит, мы можем с уверенностью обобщать результаты выборки на всю совокупность.

Как получить образцы

Существует множество различных методов , которые мы можем использовать для получения образцов из популяций.

Чтобы максимизировать шансы на получение репрезентативной выборки, мы можем использовать один из трех следующих методов:

Простая случайная выборка: случайный выбор лиц с помощью генератора случайных чисел или некоторых средств случайного отбора.

Систематическая случайная выборка: расположите каждого члена совокупности в определенном порядке. Выберите случайную начальную точку и выберите каждого n -го члена для включения в выборку.

Стратифицированная случайная выборка: разделите население на группы. Случайным образом выберите несколько членов из каждой группы для включения в выборку.

В каждом из этих методов каждый человек в популяции имеет равную вероятность быть включенным в выборку. Это максимизирует шансы на то, что мы получим выборку, которая является «мини-версией» генеральной совокупности.

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.