Одним из способов количественной оценки связи между двумя переменными является использование коэффициента корреляции Пирсона , который является мерой линейной связи между двумя переменными .
Он принимает значение от -1 до 1, где:
- -1 указывает на совершенно отрицательную линейную корреляцию.
- 0 указывает на отсутствие линейной корреляции.
- 1 указывает на совершенно положительную линейную корреляцию.
Чем дальше коэффициент корреляции от нуля, тем сильнее связь между двумя переменными.
Но в некоторых случаях мы хотим понять корреляцию между более чем одной парой переменных.
В этих случаях мы можем создать матрицу корреляции , представляющую собой квадратную таблицу, которая показывает коэффициенты корреляции между несколькими попарными комбинациями переменных.
В этом руководстве объясняется, как создать и интерпретировать корреляционную матрицу в Matlab.
Как создать корреляционную матрицу в Matlab
Используйте следующие шаги, чтобы создать матрицу корреляции в Matlab.
Шаг 1: Создайте набор данных.
rng(0);
A = randn(10,1);
B = randn(10,1);
C = randn(10,1);
all = [A B C];
Шаг 2: Создайте матрицу корреляции.
R = corrcoef(all)
R =
1.0000 0.4518 -0.5003
0.4518 1.0000 -0.8017
-0.5003 -0.8017 1.0000
Шаг 3: Интерпретируйте матрицу корреляции.
Все коэффициенты корреляции по диагонали таблицы равны 1, потому что каждая переменная полностью коррелирует сама с собой.
Все остальные коэффициенты корреляции указывают на корреляцию между различными попарными комбинациями переменных. Например:
- Коэффициент корреляции между «а» и «б» составляет 0,4518 .
- Коэффициент корреляции между «а» и «с» составляет -0,5003 .
- Коэффициент корреляции между «b» и «c» составляет -0,8017.
Шаг 4: Найдите p-значения коэффициентов корреляции.
[R,P] = corrcoef(all)
R =
1.0000 0.4518 -0.5003
0.4518 1.0000 -0.8017
-0.5003 -0.8017 1.0000
P =
1.0000 0.1899 0.1408
0.1899 1.0000 0.0053
0.1408 0.0053 1.0000
Способ интерпретации p-значений следующий:
- Значение p для коэффициента корреляции между «a» и «b» составляет 0,1899 .
- Значение р для коэффициента корреляции между «а» и «с» составляет 0,1408 .
- Значение p для коэффициента корреляции между «b» и «c» составляет 0,0053.
Если p-значение меньше некоторого уровня значимости (например, 0,05), то мы можем сказать, что корреляция между двумя переменными является статистически значимой.
В этом случае корреляция между переменными «b» и «c» является единственной статистически значимой корреляцией.
Дополнительные ресурсы
В следующих руководствах представлена дополнительная информация о матрицах корреляции:
Документация Matlab для функции corrcoef()
Как читать корреляционную матрицу
Калькулятор корреляционной матрицы