Как создать ковариационную матрицу в Google Sheets


Ковариация — это мера того, как изменения одной переменной связаны с изменениями второй переменной. В частности, это мера степени линейной связи двух переменных.

Формула для расчета ковариации между двумя переменными, X и Y :

COV( X , Y ) = Σ(x- x )(y -y )/n

Ковариационная матрица представляет собой квадратную матрицу, которая показывает ковариацию между множеством различных переменных. Это может быть полезным способом понять, как различные переменные связаны в наборе данных.

В следующем примере показано, как создать ковариационную матрицу в Google Sheets для заданного набора данных.

Как создать ковариационную матрицу в Google Sheets

Предположим, у нас есть следующий набор данных, который показывает результаты тестов 10 разных учащихся по трем предметам: математике, естественным наукам и истории.

Чтобы создать ковариационную матрицу для этого набора данных, мы можем использовать функцию COVAR() со следующим синтаксисом:

КОВАР(данные_y, данные_x)

Ковариационная матрица для этого набора данных показана в ячейках B15:D17 , а формулы, используемые для создания ковариационной матрицы, показаны в ячейках B21:D23 ниже:

Как интерпретировать ковариационную матрицу

Когда у нас есть ковариационная матрица, становится просто интерпретировать значения в матрице.

Значения по диагоналям матрицы — это просто отклонения каждого субъекта. Например:

  • Дисперсия оценок по математике составляет 64,96.
  • Дисперсия баллов по естественным наукам составляет 56,4.
  • Дисперсия оценок по истории составляет 75,56.

Другие значения в матрице представляют собой ковариации между различными субъектами. Например:

  • Ковариация между оценками по математике и естественным наукам составляет 33,2.
  • Ковариация между оценками по математике и истории составляет -24,44.
  • Ковариация между оценками по науке и истории составляет -24,1.

Положительное число для ковариации указывает на то, что две переменные имеют тенденцию увеличиваться или уменьшаться в тандеме. Например, математика и естествознание имеют положительную ковариацию (33,2), что указывает на то, что учащиеся, получившие высокие баллы по математике, также, как правило, получают высокие баллы по естественным наукам. Точно так же учащиеся с низкими баллами по математике, как правило, также имеют низкие баллы по естественным наукам.

Отрицательное число для ковариации указывает на то, что по мере увеличения одной переменной вторая переменная имеет тенденцию к уменьшению. Например, математика и история имеют отрицательную ковариацию (-24,44), что указывает на то, что учащиеся с высокими баллами по математике, как правило, имеют низкие баллы по истории. Точно так же учащиеся с низкими баллами по математике, как правило, получают высокие баллы по истории.

Дополнительные ресурсы

Как создать ковариационную матрицу в Excel
Как создать ковариационную матрицу в R
Как создать ковариационную матрицу в Python
Как создать ковариационную матрицу в SPSS