Как создать ковариационную матрицу в R


Ковариация — это мера того, как изменения одной переменной связаны с изменениями второй переменной. В частности, это мера степени линейной связи двух переменных.

Ковариационная матрица представляет собой квадратную матрицу, которая показывает ковариацию между множеством различных переменных. Это может быть полезным способом понять, как различные переменные связаны в наборе данных.

В следующем примере показано, как создать ковариационную матрицу в R.

Как создать ковариационную матрицу в R

Используйте следующие шаги, чтобы создать ковариационную матрицу в R.

Шаг 1: Создайте фрейм данных.

Во-первых, мы создадим фрейм данных, содержащий результаты тестов 10 разных учащихся по трем предметам: математике, естественным наукам и истории.

#create data frame
data <- data.frame(math = c(84, 82, 81, 89, 73, 94, 92, 70, 88, 95),
 science = c(85, 82, 72, 77, 75, 89, 95, 84, 77, 94),
 history = c(97, 94, 93, 95, 88, 82, 78, 84, 69, 78))

#view data frame
data

 math science history
1 84 85 97
2 82 82 94
3 81 72 93
4 89 77 95
5 73 75 88
6 94 89 82
7 92 95 78
8 70 84 84
9 88 77 69
10 95 94 78

Шаг 2: Создайте ковариационную матрицу.

Далее мы создадим ковариационную матрицу для этого набора данных с помощью функции cov() :

#create covariance matrix
cov(data)

 math science history
math 72.17778 36.88889 -27.15556
science 36.88889 62.66667 -26.77778
history -27.15556 -26.77778 83.95556

Шаг 3: Интерпретируйте ковариационную матрицу.

Значения по диагоналям матрицы — это просто отклонения каждого субъекта. Например:

  • Дисперсия оценок по математике составляет 72,18.
  • Дисперсия баллов по естественным наукам составляет 62,67.
  • Дисперсия оценок истории составляет 83,96.

Другие значения в матрице представляют собой ковариации между различными субъектами. Например:

  • Ковариация между оценками по математике и естественным наукам составляет 36,89.
  • Ковариация между оценками по математике и истории составляет -27,16.
  • Ковариация между оценками по науке и истории составляет -26,78.

Положительное число для ковариации указывает на то, что две переменные имеют тенденцию увеличиваться или уменьшаться в тандеме. Например, математика и естествознание имеют положительную ковариацию (36,89), что указывает на то, что учащиеся с высокими баллами по математике также, как правило, получают высокие баллы по естественным наукам. И наоборот, учащиеся с низкими баллами по математике также, как правило, имеют низкие баллы по естественным наукам.

Отрицательное число для ковариации указывает на то, что по мере увеличения одной переменной вторая переменная имеет тенденцию к уменьшению. Например, математика и история имеют отрицательную ковариацию (-27,16), что указывает на то, что учащиеся с высокими баллами по математике, как правило, имеют низкие баллы по истории. И наоборот, учащиеся с низкими баллами по математике, как правило, получают высокие баллы по истории.

Вы можете найти больше руководств по R здесь .

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.