Как выполнить точный тест Фишера в Python


Точный критерий Фишера используется для определения того, существует ли значительная связь между двумя категориальными переменными.

Обычно он используется в качестве альтернативыкритерию независимости хи-квадрат, когда количество одной или нескольких ячеек в таблице 2 × 2 меньше 5.

В этом руководстве объясняется, как выполнить точный тест Фишера в Python.

Пример: точный тест Фишера в Python

Предположим, мы хотим знать, связан ли пол с предпочтениями политической партии в конкретном колледже.

Чтобы изучить это, мы случайным образом опрашиваем 25 студентов в кампусе. Количество студентов, которые являются демократами или республиканцами, в зависимости от пола, показано в таблице ниже:

|  | демократ | республиканец | | --- | --- | --- | | женский | 8 | 4 | | Мужской | 4 | 9 |

Чтобы определить, существует ли статистически значимая связь между полом и предпочтениями политической партии, мы можем использовать следующие шаги для выполнения точного теста Фишера в Python:

Шаг 1: Создайте данные.

Сначала мы создадим таблицу для хранения наших данных:

data = [[8, 4],
 [4, 9]]

Шаг 2: Выполните точный тест Фишера.

Затем мы можем выполнить точный тест Фишера, используя функцию fisher_exact из библиотеки SciPy, которая использует следующий синтаксис:

fisher_exact (таблица, альтернатива = «двусторонний»)

куда:

  • таблица: таблица непредвиденных обстоятельств 2 × 2
  • альтернатива: определяет альтернативную гипотезу. По умолчанию используется «двусторонний», но вы также можете выбрать «меньше» или «больше» для односторонних тестов.

Следующий код показывает, как использовать эту функцию в нашем конкретном примере:

import scipy.stats as stats

print(stats.fisher_exact(data))

(4.5, 0.1152)

Значение p для тестов составляет 0,1152 .

Точный тест Фишера использует следующие нулевые и альтернативные гипотезы:

  • H 0 : (нулевая гипотеза) Две переменные независимы.
  • H 1 : (альтернативная гипотеза) Две переменные не являются независимыми.

Поскольку это значение p не менее 0,05, мы не отвергаем нулевую гипотезу.

Таким образом, у нас нет достаточных доказательств, чтобы сказать, что существует значительная связь между полом и предпочтениями политических партий.

Другими словами, предпочтения пола и политической партии не зависят друг от друга.