Доверительный интервал для разницы между средними значениями

Доверительный интервал для разницы между средними значениями

Доверительный интервал (ДИ) для разницы между средними значениями представляет собой диапазон значений, который, вероятно, содержит истинное различие между двумя средними значениями генеральной совокупности с определенным уровнем достоверности.

В этом руководстве объясняется следующее:

  • Мотивация для создания этого доверительного интервала.
  • Формула для создания этого доверительного интервала.
  • Пример того, как рассчитать этот доверительный интервал.
  • Как интерпретировать этот доверительный интервал.

CI для разницы между средствами: мотивация

Часто исследователи заинтересованы в оценке разницы между двумя средними значениями населения. Чтобы оценить эту разницу, они собирают случайную выборку из каждой совокупности и вычисляют среднее значение для каждой выборки. Затем они могут сравнить разницу между двумя средними значениями.

Однако они не могут знать наверняка, соответствует ли разница в средних значениях выборки истинной разнице в средних значениях генеральной совокупности, поэтому они могут создать доверительный интервал для разницы между двумя средними значениями. Это обеспечивает диапазон значений, который, вероятно, содержит истинную разницу между средними значениями генеральной совокупности.

Например, предположим, что мы хотим оценить разницу в среднем весе двух разных видов черепах. Поскольку в каждой популяции тысячи черепах, было бы слишком долго и дорого ходить и взвешивать каждую отдельную черепаху.

Вместо этого мы могли бы взять простую случайную выборку из 15 черепах из каждой популяции и использовать средний вес в каждой выборке, чтобы оценить истинную разницу в среднем весе между двумя популяциями:

Доверительный интервал для разницы между двумя средними значениями генеральной совокупности

Проблема в том, что наши выборки случайны, поэтому разница в средних весах между двумя выборками не обязательно точно соответствует разнице в средних весах между двумя популяциями. Итак, чтобы зафиксировать эту неопределенность, мы можем создать доверительный интервал, содержащий диапазон значений, которые, вероятно, содержат истинную разницу в среднем весе между двумя популяциями.

CI для разницы между средствами: формула

Мы используем следующую формулу для расчета доверительного интервала для разницы между двумя средними значениями:

Доверительный интервал = ( x 1 – x 2 ) +/- t * √ ((s p 2 /n 1 ) + (s p 2 /n 2 ))

куда:

  • x 1 , x 2 : среднее значение для образца 1, среднее значение для образца 2
  • t: t-критическое значение, основанное на доверительном уровне и (n 1 +n 2 -2) степенях свободы
  • s p 2 : объединенная дисперсия
  • n 1 , n 2 : размер выборки 1, размер выборки 2

куда:

CI для разницы между средствами: пример

Предположим, мы хотим оценить разницу в среднем весе между двумя разными видами черепах, поэтому мы собираем случайную выборку из 15 черепах из каждой популяции. Вот сводные данные для каждого образца:

Образец 1:

  • х 1 = 310
  • с 1 = 18,5
  • п 1 = 15

Образец 2:

  • х 2 = 300
  • с 2 = 16,4
  • п 2 = 15

Вот как найти различные доверительные интервалы для истинной разницы средних весов населения:

90% доверительный интервал:

(310-300) +/- 1,70*√((305,61/15) + (305,61/15)) = [-0,8589, 20,8589]

95% доверительный интервал:

(310-300) +/- 2,05*√((305,61/15) + (305,61/15)) = [-3,0757, 23,0757]

99% доверительный интервал:

(310-300) +/- 2,76*√((305,61/15) + (305,61/15)) = [-7,6389, 27,6389]

Примечание. Вы также можете найти эти доверительные интервалы, используя доверительный интервал Statology для калькулятора разницы между средними значениями .

Вы заметите, что чем выше уровень достоверности, тем шире доверительный интервал. Это должно иметь смысл, потому что более широкие интервалы с большей вероятностью содержат истинное среднее значение генеральной совокупности, поэтому мы более «уверены» в том, что интервал содержит истинное среднее значение генеральной совокупности.

CI для разницы между средствами : интерпретация

То, как мы интерпретируем доверительный интервал, выглядит следующим образом:

Вероятность того, что доверительный интервал [-3,0757, 23,0757] содержит истинную разницу в среднем весе между двумя популяциями черепах, составляет 95%.

Поскольку этот интервал содержит значение «0», это означает, что, возможно, нет никакой разницы в среднем весе между черепахами в этих двух популяциях. Другими словами, мы не можем с 95% уверенностью сказать, что существует разница в среднем весе между черепахами в этих двух популяциях.

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.