Что считается хорошим доверительным интервалом?


Доверительный интервал — это диапазон значений, который может содержать параметр генеральной совокупности с определенным уровнем достоверности.

У студентов часто возникает вопрос:

Что считается хорошим доверительным интервалом?

Ответ: В общем, более желательны узкие доверительные интервалы, поскольку это дает нам узкий диапазон значений, который, как мы уверены, содержит некоторый параметр генеральной совокупности.

Например, предположим, что мы хотим оценить среднюю высоту определенного вида растений и создаем следующий доверительный интервал 95%:

95% доверительный интервал = [12,5 дюймов, 60,5 дюймов]

Сравните это со следующим 95% доверительным интервалом:

95% доверительный интервал = [34 дюйма, 39 дюймов]

Второй доверительный интервал намного уже и дает нам более точное представление о том, каким может быть истинный средний рост населения.

Однако, чтобы получить узкий доверительный интервал, мы должны увеличить размер нашей выборки, что не всегда практично в реальных исследованиях.

Чтобы проиллюстрировать это, рассмотрим следующий пример.

Пример: расчет доверительного интервала

Чтобы рассчитать доверительный интервал для среднего значения генеральной совокупности , мы можем использовать следующую формулу:

Доверительный интервал = x ± z*(s/ √n )

куда:

  • x : выборочное среднее
  • z: выбранное значение z
  • s: стандартное отклонение выборки
  • n: размер выборки

Z-значение, которое вы будете использовать, зависит от выбранного вами уровня достоверности. В следующей таблице показано значение z, которое соответствует популярным вариантам выбора уровня достоверности:

| Уровень достоверности | z-значение | | --- | --- | | 0,90 | 1,645 | | 0,95 | 1,96 | | 0,99 | 2,58 |

Например, предположим, что мы собираем случайную выборку из 25 растений со следующей информацией:

  • Размер выборки n = 25
  • Средняя высота образца x = 36,5 дюймов
  • Стандартное отклонение выборки s = 18,5 дюймов

Вот как найти вычислить 95% доверительный интервал для истинного среднего роста населения:

95% доверительный интервал: 36,5 ± 1,96*(18,5/ √25 ) = [29,248, 43,752]

Мы интерпретируем этот интервал как означающий, что мы на 95% уверены, что истинная средняя высота популяции для этого вида растений составляет от 29,248 до 43,752 дюймов.

Теперь предположим, что вместо этого мы собираем следующую случайную выборку из 100 растений со следующей информацией:

  • Размер выборки n = 100
  • Средняя высота образца x = 36,5 дюймов
  • Стандартное отклонение выборки s = 18,5 дюймов

Вот как найти вычислить 95% доверительный интервал для истинного среднего роста населения:

95% доверительный интервал: 36,5 ± 1,96*(18,5/ √100 ) = [32,874, 40,126]

Мы интерпретируем этот интервал как означающий, что мы на 95% уверены, что истинная средняя высота популяции для этого вида растений составляет от 32,874 до 40,126 дюймов.

Обратите внимание, что просто увеличив размер выборки, мы смогли получить более узкий доверительный интервал для среднего значения генеральной совокупности.

В реальной ситуации исследователь предпочел бы этот второй интервал, потому что он дает более точное представление о диапазоне значений, которые могут содержать истинное среднее значение генеральной совокупности.

Однако сбор больших размеров выборки часто занимает больше времени и ресурсов, поэтому на самом деле это не всегда практично.

Также имейте в виду, что некоторые наборы данных просто имеют большую изменчивость данных, что приводит к высоким значениям стандартного отклонения выборки. Это, естественно, приводит к широким доверительным интервалам.

Таким образом, для создания «узкого» доверительного интервала единственная переменная, которую исследователи могут фактически контролировать, — это размер выборки.

Вывод

Вот краткое изложение основных моментов, сделанных в этой статье:

1. Исследователи часто считают «хорошим» доверительным интервалом узкий интервал.

2. Увеличивая размер используемой выборки, исследователи могут получить более узкие доверительные интервалы.

3. То, что считается «узким» доверительным интервалом, варьируется от одного поля к другому, потому что некоторые типы данных, естественно, имеют более высокую изменчивость, чем другие.

Связанный:Связь между размером выборки и погрешностью

Дополнительные ресурсы

В следующих руководствах представлена дополнительная информация о доверительных интервалах:

Введение в доверительные интервалы
Как сообщить о доверительных интервалах
4 примера доверительных интервалов в реальной жизни

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.