Предвзятость неполного охвата: объяснение и примеры


Систематическая ошибка недостаточного охвата — это систематическая ошибка, возникающая, когда некоторые члены совокупности неадекватно представлены в выборке.

Этот тип систематической ошибки часто возникает при выборке для удобства и при выборке добровольных ответов , когда вы собираете выборку, которую легко получить, но которая часто может привести к недостаточному охвату определенных членов совокупности.

Почему предвзятость неполного охвата является проблемой?

Систематическая ошибка недостаточного охвата представляет собой проблему, поскольку она приводит к тому, что выборка не является репрезентативной для населения. Смысл сбора данных для выборки состоит в том, чтобы получить данные более быстрым и простым способом, чем сбор данных для всей совокупности, и иметь возможность экстраполировать результаты выборки на большую совокупность.

Однако для того, чтобы экстраполировать результаты, выборка должна быть репрезентативной для нашей популяции в целом. В идеале мы хотели бы, чтобы наша выборка была «мини» версией генеральной совокупности. К сожалению, систематическая ошибка недостаточного охвата может привести к тому, что люди в нашей выборке будут значительно отличаться от людей в большей совокупности.

Например, предположим, что исследователи хотят знать, что жители определенного города думают о возможном новом законе. Чтобы собрать данные, они идут в ближайшую библиотеку и спрашивают прохожих, что они думают о возможном новом законе. Хотя это удобный способ сбора данных, исследователи рискуют не охватить несколько типов людей, в том числе:

  • Люди, прикованные к дому
  • Люди, которые просто не любят посещать библиотеку
  • Люди, которые ходят в другую библиотеку в другой части города

Поскольку это исследование исключает определенные типы людей, результаты исследования вряд ли будут репрезентативными для населения.

Например, предположим, что люди, которые ходят в эту конкретную библиотеку, с гораздо большей вероятностью поддержат потенциальный новый закон по сравнению с остальным населением. Это означает, что когда будут получены результаты опроса, окажется, что большой процент граждан в этом городе поддерживает потенциальный новый закон, тогда как на самом деле большинство граждан этого не делают.

Наглядное изображение ниже иллюстрирует эту проблему: предположим, что зеленые кружки представляют людей, которые поддерживают новый закон, а красные кружки представляют людей, которые выступают против нового закона:

Пример систематической ошибки недостаточного охвата в удобной выборке

Обратите внимание, что большинство людей, поддерживающих новый закон, включены в выборку, но она не является репрезентативной для большей части населения. Результаты опроса показали бы, что большинство людей поддерживают новый закон, хотя на самом деле это не так.

Примеры систематической ошибки недостаточного охвата

Следующие примеры иллюстрируют несколько случаев, в которых может иметь место систематическая ошибка недостаточного охвата.

Пример 1

Исследователи хотят узнать, что жители определенного города думают о строительстве нового парка. Чтобы собрать данные, исследователи посещают местное городское собрание и расспрашивают людей об их мыслях. К сожалению, эта форма удобной выборки может страдать от недостаточного охвата следующих групп:

  • Люди, у которых нет доступа к транспорту, чтобы пойти на городские собрания
  • Люди, которые даже не знают о том факте, что городские собрания проходят
  • Люди, которые работают по вечерам и просто не могут посещать городские собрания

Таким образом, мнения этих людей не будут включены в результаты исследования. Из-за недостаточного охвата этих конкретных групп выборка вряд ли будет репрезентативной для большей части населения.

Пример 2

Исследователи хотят знать, сколько часов в день люди смотрят телевизор в том или ином округе. Чтобы собрать данные для исследования, они случайным образом выбирают имена из местной телефонной книги и звонят людям, чтобы спросить их о том, как они смотрят телевизор. Это форма удобной выборки, и она может пострадать от недостаточного охвата следующих групп:

  • Очень богатые люди, которые не указывают свои номера телефонов в местных телефонных справочниках.
  • Молодые люди, которые пользуются только мобильными телефонами и не имеют своих номеров в местных телефонных справочниках.

Таким образом, в этом исследовании будет скрыто количество телепередач, которые смотрят очень богатые люди и молодежь. Из-за недостаточного охвата этих конкретных групп выборка вряд ли будет репрезентативной для большей части населения.

Пример 3

Исследователи хотят знать, что жители того или иного города думают о новом правиле дорожного движения, поэтому они раздают анкеты людям, проходящим мимо в местном торговом центре. Это форма удобной выборки, и она может пострадать от недостаточного охвата следующих групп:

  • Люди, у которых нет доступа к транспорту, чтобы добраться до торгового центра (и, следовательно, на них практически не распространяются правила дорожного движения)
  • Люди, которые не любят ходить в торговый центр (и поэтому могут не ездить в оживленных районах)
  • Люди, которые ходят в другой торговый центр в другом городе

Таким образом, мнения этих людей не будут включены в результаты исследования. Из-за недостаточного охвата этих конкретных групп выборка вряд ли будет репрезентативной для большей части населения.

Как предотвратить предвзятость неполного охвата

Систематическая ошибка недостаточного охвата часто возникает в результате удобной выборки. Чтобы устранить (или, по крайней мере, свести к минимуму) последствия систематической ошибки недостаточного охвата, лучшей формой выборки является использование простой случайной выборки .

В этом типе выборки каждый член генеральной совокупности имеет равные шансы попасть в выборку.

Преимущество этого подхода заключается в том, что простые случайные выборки обычно репрезентативны для интересующей нас совокупности, поскольку каждый член имеет равные шансы быть включенным в выборку.

Когда мы используем этот подход вместо удобной выборки, мы можем быть более уверены в своей способности экстраполировать результаты выборки на большую совокупность, поскольку вполне вероятно, что в выборку включены представители каждой (или почти каждой) группы населения. .

Дополнительные ресурсы

Что такое предвзятость самоотбора?
Что такое реферальная предвзятость?
Что такое систематическая ошибка неответа?

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.