Доверительный интервал для коэффициента корреляции


Доверительный интервал для коэффициента корреляции — это диапазон значений, который может содержать коэффициент корреляции совокупности с определенным уровнем достоверности.

В этом руководстве объясняется следующее:

  • Мотивация для создания этого типа доверительного интервала.
  • Формула для создания этого типа доверительного интервала.
  • Пример того, как создать этот тип доверительного интервала.
  • Как интерпретировать этот тип доверительного интервала.

Доверительный интервал для коэффициента корреляции: мотивация

Причина создания доверительного интервала для коэффициента корреляции состоит в том, чтобы зафиксировать нашу неопределенность при оценке коэффициента корреляции совокупности.

Например, предположим, что мы хотим оценить коэффициент корреляции между ростом и весом жителей определенного округа. Поскольку в округе проживают тысячи жителей, было бы слишком дорого и долго собирать информацию о росте и весе каждого жителя.

Вместо этого мы могли бы выбрать простую случайную выборку жителей и просто собрать информацию о них.

Поскольку мы выбираем случайную выборку жителей, нет гарантии, что коэффициент корреляции между ростом и весом для этих жителей в выборке будет точно соответствовать коэффициенту корреляции в большей совокупности.

Итак, чтобы зафиксировать эту неопределенность, мы можем создать доверительный интервал, содержащий диапазон значений, которые, вероятно, содержат истинный коэффициент корреляции между ростом и весом жителей этого округа.

Доверительный интервал для коэффициента корреляции: формула

Мы используем следующие шаги для расчета доверительного интервала для коэффициента корреляции совокупности на основе размера выборки n и коэффициента корреляции выборки r .

Шаг 1: Выполните преобразование Фишера.

Пусть z r = ln((1+r)/(1-r))/2

Шаг 2: Найдите верхнюю и нижнюю границы журнала.

Пусть L = z r – (z 1-α/2 /√ n-3 )

Пусть U = z r + (z 1-α/2 /√ n-3 )

Шаг 3: Найдите доверительный интервал.

Окончательный доверительный интервал можно найти по следующей формуле:

Доверительный интервал = [(e 2L -1)/(e 2L +1), (e 2U -1)/(e 2U +1)]

Доверительный интервал для коэффициента корреляции: пример

Предположим, мы хотим оценить коэффициент корреляции между ростом и весом жителей определенного округа. Выбираем случайную выборку из 30 жителей и находим следующую информацию:

  • Размер выборки n = 30
  • Коэффициент корреляции между ростом и весом r = 0,56.

Вот как найти 95% доверительный интервал для коэффициента корреляции населения:

Шаг 1: Выполните преобразование Фишера.

Пусть z r = ln((1+r)/(1-r))/2 = ln((1+0,56)/(1-0,56))/2 = 0,6328

Шаг 2: Найдите верхнюю и нижнюю границы журнала.

Пусть L = z r – (z 1-α/2 /√ n-3 ) = 0,6328 – (1,96 /√ 30-3 ) = 0,2556

Пусть U = z r + (z 1-α/2 /√ n-3 ) = 0,6328 + (1,96 /√ 30-3 ) = 1,01

Шаг 3: Найдите доверительный интервал.

Доверительный интервал = [(e 2L -1)/(e 2L +1), (e 2U -1)/(e 2U +1)]

Доверительный интервал = [(e 2 (0,2556) -1)/(e 2 (0,2556) +1), (e 2 (1,01) -1)/(e 2 (1,01) +1)] = [0,2502 , .7658]

Примечание. Этот доверительный интервал также можно найти с помощью калькулятора доверительного интервала для коэффициента корреляции .

Доверительный интервал для коэффициента корреляции: интерпретация

То, как мы интерпретируем доверительный интервал, выглядит следующим образом:

Существует вероятность 95%, что доверительный интервал [0,2502, 0,7658] содержит истинный коэффициент популяционной корреляции между ростом и весом жителей этого округа.

Другой способ сказать то же самое состоит в том, что существует только 5% вероятность того, что истинный коэффициент корреляции населения находится за пределами 95% доверительного интервала.

То есть существует только 5% вероятность того, что истинный коэффициент популяционной корреляции между ростом и весом жителей этого округа меньше 0,2502 или больше 0,7658.