Как создать ковариационную матрицу в R


Ковариация — это мера того, как изменения одной переменной связаны с изменениями второй переменной. В частности, это мера степени линейной связи двух переменных.

Ковариационная матрица представляет собой квадратную матрицу, которая показывает ковариацию между множеством различных переменных. Это может быть полезным способом понять, как различные переменные связаны в наборе данных.

В следующем примере показано, как создать ковариационную матрицу в R.

Как создать ковариационную матрицу в R

Используйте следующие шаги, чтобы создать ковариационную матрицу в R.

Шаг 1: Создайте фрейм данных.

Во-первых, мы создадим фрейм данных, содержащий результаты тестов 10 разных учащихся по трем предметам: математике, естественным наукам и истории.

#create data frame
data <- data.frame(math = c(84, 82, 81, 89, 73, 94, 92, 70, 88, 95),
 science = c(85, 82, 72, 77, 75, 89, 95, 84, 77, 94),
 history = c(97, 94, 93, 95, 88, 82, 78, 84, 69, 78))

#view data frame
data

 math science history
1 84 85 97
2 82 82 94
3 81 72 93
4 89 77 95
5 73 75 88
6 94 89 82
7 92 95 78
8 70 84 84
9 88 77 69
10 95 94 78

Шаг 2: Создайте ковариационную матрицу.

Далее мы создадим ковариационную матрицу для этого набора данных с помощью функции cov() :

#create covariance matrix
cov(data)

 math science history
math 72.17778 36.88889 -27.15556
science 36.88889 62.66667 -26.77778
history -27.15556 -26.77778 83.95556

Шаг 3: Интерпретируйте ковариационную матрицу.

Значения по диагоналям матрицы — это просто отклонения каждого субъекта. Например:

  • Дисперсия оценок по математике составляет 72,18.
  • Дисперсия баллов по естественным наукам составляет 62,67.
  • Дисперсия оценок истории составляет 83,96.

Другие значения в матрице представляют собой ковариации между различными субъектами. Например:

  • Ковариация между оценками по математике и естественным наукам составляет 36,89.
  • Ковариация между оценками по математике и истории составляет -27,16.
  • Ковариация между оценками по науке и истории составляет -26,78.

Положительное число для ковариации указывает на то, что две переменные имеют тенденцию увеличиваться или уменьшаться в тандеме. Например, математика и естествознание имеют положительную ковариацию (36,89), что указывает на то, что учащиеся с высокими баллами по математике также, как правило, получают высокие баллы по естественным наукам. И наоборот, учащиеся с низкими баллами по математике также, как правило, имеют низкие баллы по естественным наукам.

Отрицательное число для ковариации указывает на то, что по мере увеличения одной переменной вторая переменная имеет тенденцию к уменьшению. Например, математика и история имеют отрицательную ковариацию (-27,16), что указывает на то, что учащиеся с высокими баллами по математике, как правило, имеют низкие баллы по истории. И наоборот, учащиеся с низкими баллами по математике, как правило, получают высокие баллы по истории.

Вы можете найти больше руководств по R здесь .