Доверительный интервал для коэффициента корреляции — это диапазон значений, который может содержать коэффициент корреляции совокупности с определенным уровнем достоверности.
В этом руководстве объясняется следующее:
- Мотивация для создания этого типа доверительного интервала.
- Формула для создания этого типа доверительного интервала.
- Пример того, как создать этот тип доверительного интервала.
- Как интерпретировать этот тип доверительного интервала.
Доверительный интервал для коэффициента корреляции: мотивация
Причина создания доверительного интервала для коэффициента корреляции состоит в том, чтобы зафиксировать нашу неопределенность при оценке коэффициента корреляции совокупности.
Например, предположим, что мы хотим оценить коэффициент корреляции между ростом и весом жителей определенного округа. Поскольку в округе проживают тысячи жителей, было бы слишком дорого и долго собирать информацию о росте и весе каждого жителя.
Вместо этого мы могли бы выбрать простую случайную выборку жителей и просто собрать информацию о них.

Поскольку мы выбираем случайную выборку жителей, нет гарантии, что коэффициент корреляции между ростом и весом для этих жителей в выборке будет точно соответствовать коэффициенту корреляции в большей совокупности.
Итак, чтобы зафиксировать эту неопределенность, мы можем создать доверительный интервал, содержащий диапазон значений, которые, вероятно, содержат истинный коэффициент корреляции между ростом и весом жителей этого округа.
Доверительный интервал для коэффициента корреляции: формула
Мы используем следующие шаги для расчета доверительного интервала для коэффициента корреляции совокупности на основе размера выборки n и коэффициента корреляции выборки r .
Шаг 1: Выполните преобразование Фишера.
Пусть z r = ln((1+r)/(1-r))/2
Шаг 2: Найдите верхнюю и нижнюю границы журнала.
Пусть L = z r – (z 1-α/2 /√ n-3 )
Пусть U = z r + (z 1-α/2 /√ n-3 )
Шаг 3: Найдите доверительный интервал.
Окончательный доверительный интервал можно найти по следующей формуле:
Доверительный интервал = [(e 2L -1)/(e 2L +1), (e 2U -1)/(e 2U +1)]
Доверительный интервал для коэффициента корреляции: пример
Предположим, мы хотим оценить коэффициент корреляции между ростом и весом жителей определенного округа. Выбираем случайную выборку из 30 жителей и находим следующую информацию:
- Размер выборки n = 30
- Коэффициент корреляции между ростом и весом r = 0,56.
Вот как найти 95% доверительный интервал для коэффициента корреляции населения:
Шаг 1: Выполните преобразование Фишера.
Пусть z r = ln((1+r)/(1-r))/2 = ln((1+0,56)/(1-0,56))/2 = 0,6328
Шаг 2: Найдите верхнюю и нижнюю границы журнала.
Пусть L = z r – (z 1-α/2 /√ n-3 ) = 0,6328 – (1,96 /√ 30-3 ) = 0,2556
Пусть U = z r + (z 1-α/2 /√ n-3 ) = 0,6328 + (1,96 /√ 30-3 ) = 1,01
Шаг 3: Найдите доверительный интервал.
Доверительный интервал = [(e 2L -1)/(e 2L +1), (e 2U -1)/(e 2U +1)]
Доверительный интервал = [(e 2 (0,2556) -1)/(e 2 (0,2556) +1), (e 2 (1,01) -1)/(e 2 (1,01) +1)] = [0,2502 , .7658]
Примечание. Этот доверительный интервал также можно найти с помощью калькулятора доверительного интервала для коэффициента корреляции .
Доверительный интервал для коэффициента корреляции: интерпретация
То, как мы интерпретируем доверительный интервал, выглядит следующим образом:
Существует вероятность 95%, что доверительный интервал [0,2502, 0,7658] содержит истинный коэффициент популяционной корреляции между ростом и весом жителей этого округа.
Другой способ сказать то же самое состоит в том, что существует только 5% вероятность того, что истинный коэффициент корреляции населения находится за пределами 95% доверительного интервала.
То есть существует только 5% вероятность того, что истинный коэффициент популяционной корреляции между ростом и весом жителей этого округа меньше 0,2502 или больше 0,7658.