Как создать матрицу корреляции в MATLAB


Одним из способов количественной оценки связи между двумя переменными является использование коэффициента корреляции Пирсона , который является мерой линейной связи между двумя переменными .

Он принимает значение от -1 до 1, где:

  • -1 указывает на совершенно отрицательную линейную корреляцию.
  • 0 указывает на отсутствие линейной корреляции.
  • 1 указывает на совершенно положительную линейную корреляцию.

Чем дальше коэффициент корреляции от нуля, тем сильнее связь между двумя переменными.

Но в некоторых случаях мы хотим понять корреляцию между более чем одной парой переменных.

В этих случаях мы можем создать матрицу корреляции , представляющую собой квадратную таблицу, которая показывает коэффициенты корреляции между несколькими попарными комбинациями переменных.

В этом руководстве объясняется, как создать и интерпретировать корреляционную матрицу в Matlab.

Как создать корреляционную матрицу в Matlab

Используйте следующие шаги, чтобы создать матрицу корреляции в Matlab.

Шаг 1: Создайте набор данных.

rng(0);

A = randn(10,1);
B = randn(10,1);
C = randn(10,1);
all = [A B C];

Шаг 2: Создайте матрицу корреляции.

R = corrcoef(all)

R =

 1.0000 0.4518 -0.5003
 0.4518 1.0000 -0.8017
 -0.5003 -0.8017 1.0000

Шаг 3: Интерпретируйте матрицу корреляции.

Все коэффициенты корреляции по диагонали таблицы равны 1, потому что каждая переменная полностью коррелирует сама с собой.

Все остальные коэффициенты корреляции указывают на корреляцию между различными попарными комбинациями переменных. Например:

  • Коэффициент корреляции между «а» и «б» составляет 0,4518 .
  • Коэффициент корреляции между «а» и «с» составляет -0,5003 .
  • Коэффициент корреляции между «b» и «c» составляет -0,8017.

Шаг 4: Найдите p-значения коэффициентов корреляции.

[R,P] = corrcoef(all)

R =

 1.0000 0.4518 -0.5003
 0.4518 1.0000 -0.8017
 -0.5003 -0.8017 1.0000

P =

 1.0000 0.1899 0.1408
 0.1899 1.0000 0.0053
 0.1408 0.0053 1.0000

Способ интерпретации p-значений следующий:

  • Значение p для коэффициента корреляции между «a» и «b» составляет 0,1899 .
  • Значение р для коэффициента корреляции между «а» и «с» составляет 0,1408 .
  • Значение p для коэффициента корреляции между «b» и «c» составляет 0,0053.

Если p-значение меньше некоторого уровня значимости (например, 0,05), то мы можем сказать, что корреляция между двумя переменными является статистически значимой.

В этом случае корреляция между переменными «b» и «c» является единственной статистически значимой корреляцией.

Дополнительные ресурсы

В следующих руководствах представлена дополнительная информация о матрицах корреляции:

Документация Matlab для функции corrcoef()
Как читать корреляционную матрицу
Калькулятор корреляционной матрицы