Тест хи-квадрат против t-теста: в чем разница?


Тесты хи-квадрат и t-тесты являются двумя наиболее распространенными типами статистических тестов. Таким образом, важно понимать разницу между этими двумя тестами и знать, когда использовать каждый из них в зависимости от проблемы, на которую вы хотите ответить.

В этом руководстве дается простое объяснение различий между двумя тестами, а также поясняется, когда использовать каждый из них.

Хи-квадрат Тест

На самом деле существует несколько различных версий теста хи-квадрат, но наиболее распространенным является тест независимости хи-квадрат .

Определение

Мы используем тест хи-квадрат на независимость , когда хотим формально проверить, существует ли статистически значимая связь между двумя категориальными переменными.

Гипотезы теста следующие:

Нулевая гипотеза (H 0 ): между двумя переменными нет существенной связи.

Альтернативная гипотеза: (Ha): существует значительная связь между двумя переменными.

Примеры

Вот несколько примеров, когда мы можем использовать критерий хи-квадрат для независимости:

Пример 1: Мы хотим знать, существует ли статистически значимая связь между полом (мужской, женский) и предпочтениями политической партии (республиканец, демократ, независимый). Чтобы проверить это, мы можем опросить 100 случайных людей и записать их предпочтения по полу и политическим партиям. Затем мы можем провести тест хи-квадрат на независимость, чтобы определить, существует ли статистически значимая связь между полом и предпочтениями политической партии.

Пример 2: Мы хотим узнать, существует ли статистически значимая связь между уровнем класса (первокурсник, второкурсник, младший, старший) и любимым жанром фильма (триллер, драма, вестерн). Чтобы проверить это, мы можем опросить 100 случайных учеников каждого класса в определенной школе и записать их любимый жанр фильмов. Затем мы можем провести тест хи-квадрат на независимость, чтобы определить, существует ли статистически значимая связь между уровнем класса и любимым жанром кино.

Пример 3: Мы хотим узнать, существует ли статистически значимая связь между любимым видом спорта человека (баскетбол, бейсбол, футбол) и местом, где он вырос (город, сельская местность). Чтобы проверить это, мы можем опросить 100 случайных людей и спросить их, в каком месте они выросли и какой у них любимый вид спорта. Затем мы можем провести тест хи-квадрат на независимость, чтобы определить, существует ли статистически значимая связь между любимым видом спорта человека и местом, где он вырос.

Предположения

Прежде чем мы сможем провести тест хи-квадрат на независимость, нам сначала нужно убедиться, что выполняются следующие предположения, чтобы гарантировать, что наш тест будет действительным:

  • Случайная выборка: для сбора данных для обеих выборок следует использовать случайную выборку или случайный эксперимент.
  • Категоричность: переменные, которые мы изучаем, должны быть категоричны.
  • Размер: ожидаемое количество наблюдений на каждом уровне переменной должно быть не менее 5.

Если эти предположения выполняются, то мы можем провести тест.

t-тест

Есть также несколько различных версий t-критерия, но наиболее распространенным является t-критерий для разницы в средних .

Определение

Мы используем t-критерий для различия средних значений , когда хотим формально проверить, существует ли статистически значимая разница между двумя средними значениями совокупности.

Гипотезы теста следующие:

Нулевая гипотеза (H 0 ): два средних значения совокупности равны.

Альтернативная гипотеза: (Ha): два средних значения совокупности не равны.

Примечание. Можно проверить, больше или меньше одно среднее значение генеральной совокупности, но наиболее распространенная нулевая гипотеза состоит в том, что оба средних значения равны.

Примеры

Вот несколько примеров, когда мы можем использовать t-критерий для различия в средних значениях:

Пример 1: Мы хотим знать, приводит ли диета А или диета Б к большей потере веса. Мы случайным образом назначаем 100 человек соблюдать диету А в течение двух месяцев, а еще 100 человек — придерживаться диеты Б в течение двух месяцев. Мы можем провести t-тест на разницу в средних значениях, чтобы определить, есть ли статистически значимая разница в средней потере веса между двумя группами.

Пример 2: Мы хотим знать, приводят ли два разных плана обучения к разным экзаменационным баллам для студентов. Мы случайным образом назначаем 50 студентов для использования одного учебного плана и 50 студентов для использования другого учебного плана в течение одного месяца до экзамена. Мы можем провести t-тест на разницу в средних значениях, чтобы определить, есть ли статистически значимая разница в средних баллах по экзаменам между двумя планами обучения.

Пример 3: Мы хотим узнать, имеют ли ученики из двух разных школ одинаковый средний рост. Мы измеряем рост 100 случайных учеников из одной школы и 100 случайных учеников из другой школы. Мы можем провести t-тест на разницу в средних значениях, чтобы определить, есть ли статистически значимая разница в среднем росте учащихся между двумя школами.

Предположения

Прежде чем мы сможем провести проверку гипотезы о разнице между двумя средними значениями совокупности, нам сначала нужно убедиться, что выполняются следующие условия, чтобы гарантировать, что наша проверка гипотезы будет достоверной:

  • Случайная выборка: для сбора данных для обеих выборок следует использовать случайную выборку или случайный эксперимент.
  • Нормальное: распределение выборки нормальное или приблизительно нормальное.
  • Независимость: две выборки независимы.

Если эти предположения выполняются, то мы можем провести проверку гипотезы.

Как узнать, когда использовать каждый тест

Вот краткий обзор каждого теста:

Тест хи-квадрат на независимость: позволяет проверить, существует ли статистически значимая связь между двумя категориальными переменными. Когда вы отвергаете нулевую гипотезу теста хи-квадрат на независимость, это означает, что между двумя переменными существует значительная связь.

Стьюдентный тест на разницу в средних значениях: позволяет проверить, существует ли статистически значимая разница между двумя средними значениями генеральной совокупности. Когда вы отклоняете нулевую гипотезу t-теста о разнице в средних, это означает, что две средние популяции не равны.

Самый простой способ узнать, использовать ли критерий хи-квадрат или t-критерий, — это просто посмотреть на типы переменных, с которыми вы работаете.

Если у вас есть две переменные, обе из которых являются категориальными, т. е. их можно отнести к таким категориям, как « мужской », « женский » и « республиканец », « демократ », « независимый », то вам следует использовать критерий хи-квадрат.

Но если одна переменная является категориальной (например, тип учебного плана — либо план 1, либо план 2), а другая — непрерывной (например, экзаменационный балл — измеряется от 0 до 100), то вам следует использовать t-критерий.