Как выполнить точный тест Фишера в Python


Точный критерий Фишера используется для определения того, существует ли значительная связь между двумя категориальными переменными.

Обычно он используется в качестве альтернативыкритерию независимости хи-квадрат, когда количество одной или нескольких ячеек в таблице 2 × 2 меньше 5.

В этом руководстве объясняется, как выполнить точный тест Фишера в Python.

Пример: точный тест Фишера в Python

Предположим, мы хотим знать, связан ли пол с предпочтениями политической партии в конкретном колледже.

Чтобы изучить это, мы случайным образом опрашиваем 25 студентов в кампусе. Количество студентов, которые являются демократами или республиканцами, в зависимости от пола, показано в таблице ниже:

|  | демократ | республиканец | | --- | --- | --- | | женский | 8 | 4 | | Мужской | 4 | 9 |

Чтобы определить, существует ли статистически значимая связь между полом и предпочтениями политической партии, мы можем использовать следующие шаги для выполнения точного теста Фишера в Python:

Шаг 1: Создайте данные.

Сначала мы создадим таблицу для хранения наших данных:

data = [[8, 4],
 [4, 9]]

Шаг 2: Выполните точный тест Фишера.

Затем мы можем выполнить точный тест Фишера, используя функцию fisher_exact из библиотеки SciPy, которая использует следующий синтаксис:

fisher_exact (таблица, альтернатива = «двусторонний»)

куда:

  • таблица: таблица непредвиденных обстоятельств 2 × 2
  • альтернатива: определяет альтернативную гипотезу. По умолчанию используется «двусторонний», но вы также можете выбрать «меньше» или «больше» для односторонних тестов.

Следующий код показывает, как использовать эту функцию в нашем конкретном примере:

import scipy.stats as stats

print(stats.fisher_exact(data))

(4.5, 0.1152)

Значение p для тестов составляет 0,1152 .

Точный тест Фишера использует следующие нулевые и альтернативные гипотезы:

  • H 0 : (нулевая гипотеза) Две переменные независимы.
  • H 1 : (альтернативная гипотеза) Две переменные не являются независимыми.

Поскольку это значение p не менее 0,05, мы не отвергаем нулевую гипотезу.

Таким образом, у нас нет достаточных доказательств, чтобы сказать, что существует значительная связь между полом и предпочтениями политических партий.

Другими словами, предпочтения пола и политической партии не зависят друг от друга.

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.