Как выполнить точный тест Фишера в Excel


Точный критерий Фишера используется для определения того, существует ли значительная связь между двумя категориальными переменными. Обычно он используется в качестве альтернативы критерию независимости хи-квадрат, когда количество одной или нескольких ячеек в таблице 2 × 2 меньше 5.

В этом руководстве объясняется, как выполнить точный критерий Фишера в Excel.

Пример: точный критерий Фишера в Excel

Предположим, мы хотим знать, связан ли пол с предпочтениями политической партии в конкретном колледже. Чтобы изучить это, мы случайным образом опрашиваем 25 студентов в кампусе. Количество студентов, которые являются демократами или республиканцами, в зависимости от пола, показано в таблице ниже:

Чтобы определить, существует ли статистически значимая связь между полом и предпочтениями политической партии, мы можем выполнить точный тест Фишера.

Хотя в Excel нет встроенной функции для выполнения этого теста, мы можем использовать гипергеометрическую функцию для выполнения теста, которая использует следующий синтаксис:

=HYPGEOM.DIST(выборка_s, число_выборка, совокупность_s, число_население, кумулятивный)

куда:

  • sample_s = количество «успехов» в образце
  • number_sample = размер выборки
  • населения_s = количество «успехов» в популяции
  • number_pop = численность населения
  • cumulative = если TRUE, возвращает кумулятивную функцию распределения; если FALSE, это возвращает функцию массы вероятности. Для наших целей мы всегда будем использовать TRUE.

Чтобы применить эту функцию к нашему примеру, мы выберем для использования одну из четырех ячеек в таблице 2×2. Подойдет любая ячейка, но в этом примере мы будем использовать верхнюю левую ячейку со значением «4».

Далее мы заполним следующие значения для функции:

= HYPGEOM.DIST (значение в отдельной ячейке, общее количество столбцов, общее количество строк, общий размер выборки, TRUE)

Это дает одностороннее p-значение 0,0812 .

Чтобы найти двустороннее p-значение для теста, мы сложим вместе следующие две вероятности:

  • Вероятность получения x «успехов» в интересующей нас ячейке. В нашем случае это вероятность получения 4 успехов (мы уже нашли эту вероятность равной 0,0812).
  • 1 — вероятность попадания (общее количество столбцов — х «успехов») в интересующую нас ячейку. В этом случае общее количество столбцов для демократа равно 12, поэтому мы найдем 1 — (вероятность 8 « успехов»)

Вот формула, которую мы будем использовать:

Это дает двустороннее p-значение 0,1152 .

В любом случае, проводим ли мы односторонний или двусторонний тест, p-значение не меньше 0,05, поэтому мы не можем отвергнуть нулевую гипотезу. Другими словами, у нас нет достаточных доказательств, чтобы сказать, что существует значительная связь между полом и предпочтениями политических партий.

Дополнительные ресурсы

Как выполнить тест независимости хи-квадрат в Excel
Как выполнить критерий согласия хи-квадрат в Excel
Как рассчитать V Крамера в Excel