Как рассчитать V Крамера в Python


V Крамера — это мера силы связи между двумя номинальными переменными .

Он находится в диапазоне от 0 до 1, где:

  • 0 указывает на отсутствие связи между двумя переменными.
  • 1 указывает на сильную связь между двумя переменными.

Он рассчитывается как:

V Крамера = √ (X 2 /n) / мин (c-1, r-1)

куда:

  • X 2 : Статистика хи-квадрат
  • n: общий размер выборки
  • р: количество рядов
  • c: количество столбцов

В этом руководстве представлено несколько примеров того, как рассчитать V Крамера для таблицы непредвиденных обстоятельств в Python.

Пример 1: V Крамера для таблицы 2 × 2

Следующий код показывает, как вычислить V Крамера для таблицы 2×2:

#load necessary packages and functions
import scipy. stats as stats
import numpy as np

#create 2x2 table
data = np.array([[7,12], [9,8]])

#Chi-squared test statistic, sample size, and minimum of rows and columns
X2 = stats. chi2_contingency (data, correction= False )[0]
n = np.sum (data)
minDim = min(data. shape )-1

#calculate Cramer's V 
V = np.sqrt ((X2/n) / minDim)

#display Cramer's V
print(V)

0.1617

V Крамера оказывается равным 0,1617 , что указывает на довольно слабую связь между двумя переменными в таблице.

Пример 2: V Крамера для больших таблиц

Обратите внимание, что мы можем использовать функцию CramerV для вычисления V Крамера для таблицы любого размера.

Следующий код показывает, как вычислить V Крамера для таблицы с 2 строками и 3 столбцами:

#load necessary packages and functions
import scipy. stats as stats
import numpy as np

#create 2x2 table
data = np.array([[6,9], [8, 5], [12, 9]])

#Chi-squared test statistic, sample size, and minimum of rows and columns
X2 = stats. chi2_contingency (data, correction= False )[0]
n = np.sum (data)
minDim = min(data. shape )-1

#calculate Cramer's V 
V = np.sqrt ((X2/n) / minDim)

#display Cramer's V
print(V)

0.1775

V Крамера оказывается равным 0,1775 .

Обратите внимание, что в этом примере использовалась таблица с 2 строками и 3 столбцами, но точно такой же код работает для таблицы любых размеров.

Дополнительные ресурсы

Тест независимости хи-квадрат в Python
Хи-квадратный тест на соответствие в Python
Точный тест Фишера в Python