Тест хи-квадрат против t-теста: в чем разница?


Тесты хи-квадрат и t-тесты являются двумя наиболее распространенными типами статистических тестов. Таким образом, важно понимать разницу между этими двумя тестами и знать, когда использовать каждый из них в зависимости от проблемы, на которую вы хотите ответить.

В этом руководстве дается простое объяснение различий между двумя тестами, а также поясняется, когда использовать каждый из них.

Хи-квадрат Тест

На самом деле существует несколько различных версий теста хи-квадрат, но наиболее распространенным является тест независимости хи-квадрат .

Определение

Мы используем тест хи-квадрат на независимость , когда хотим формально проверить, существует ли статистически значимая связь между двумя категориальными переменными.

Гипотезы теста следующие:

Нулевая гипотеза (H 0 ): между двумя переменными нет существенной связи.

Альтернативная гипотеза: (Ha): существует значительная связь между двумя переменными.

Примеры

Вот несколько примеров, когда мы можем использовать критерий хи-квадрат для независимости:

Пример 1: Мы хотим знать, существует ли статистически значимая связь между полом (мужской, женский) и предпочтениями политической партии (республиканец, демократ, независимый). Чтобы проверить это, мы можем опросить 100 случайных людей и записать их предпочтения по полу и политическим партиям. Затем мы можем провести тест хи-квадрат на независимость, чтобы определить, существует ли статистически значимая связь между полом и предпочтениями политической партии.

Пример 2: Мы хотим узнать, существует ли статистически значимая связь между уровнем класса (первокурсник, второкурсник, младший, старший) и любимым жанром фильма (триллер, драма, вестерн). Чтобы проверить это, мы можем опросить 100 случайных учеников каждого класса в определенной школе и записать их любимый жанр фильмов. Затем мы можем провести тест хи-квадрат на независимость, чтобы определить, существует ли статистически значимая связь между уровнем класса и любимым жанром кино.

Пример 3: Мы хотим узнать, существует ли статистически значимая связь между любимым видом спорта человека (баскетбол, бейсбол, футбол) и местом, где он вырос (город, сельская местность). Чтобы проверить это, мы можем опросить 100 случайных людей и спросить их, в каком месте они выросли и какой у них любимый вид спорта. Затем мы можем провести тест хи-квадрат на независимость, чтобы определить, существует ли статистически значимая связь между любимым видом спорта человека и местом, где он вырос.

Предположения

Прежде чем мы сможем провести тест хи-квадрат на независимость, нам сначала нужно убедиться, что выполняются следующие предположения, чтобы гарантировать, что наш тест будет действительным:

  • Случайная выборка: для сбора данных для обеих выборок следует использовать случайную выборку или случайный эксперимент.
  • Категоричность: переменные, которые мы изучаем, должны быть категоричны.
  • Размер: ожидаемое количество наблюдений на каждом уровне переменной должно быть не менее 5.

Если эти предположения выполняются, то мы можем провести тест.

t-тест

Есть также несколько различных версий t-критерия, но наиболее распространенным является t-критерий для разницы в средних .

Определение

Мы используем t-критерий для различия средних значений , когда хотим формально проверить, существует ли статистически значимая разница между двумя средними значениями совокупности.

Гипотезы теста следующие:

Нулевая гипотеза (H 0 ): два средних значения совокупности равны.

Альтернативная гипотеза: (Ha): два средних значения совокупности не равны.

Примечание. Можно проверить, больше или меньше одно среднее значение генеральной совокупности, но наиболее распространенная нулевая гипотеза состоит в том, что оба средних значения равны.

Примеры

Вот несколько примеров, когда мы можем использовать t-критерий для различия в средних значениях:

Пример 1: Мы хотим знать, приводит ли диета А или диета Б к большей потере веса. Мы случайным образом назначаем 100 человек соблюдать диету А в течение двух месяцев, а еще 100 человек — придерживаться диеты Б в течение двух месяцев. Мы можем провести t-тест на разницу в средних значениях, чтобы определить, есть ли статистически значимая разница в средней потере веса между двумя группами.

Пример 2: Мы хотим знать, приводят ли два разных плана обучения к разным экзаменационным баллам для студентов. Мы случайным образом назначаем 50 студентов для использования одного учебного плана и 50 студентов для использования другого учебного плана в течение одного месяца до экзамена. Мы можем провести t-тест на разницу в средних значениях, чтобы определить, есть ли статистически значимая разница в средних баллах по экзаменам между двумя планами обучения.

Пример 3: Мы хотим узнать, имеют ли ученики из двух разных школ одинаковый средний рост. Мы измеряем рост 100 случайных учеников из одной школы и 100 случайных учеников из другой школы. Мы можем провести t-тест на разницу в средних значениях, чтобы определить, есть ли статистически значимая разница в среднем росте учащихся между двумя школами.

Предположения

Прежде чем мы сможем провести проверку гипотезы о разнице между двумя средними значениями совокупности, нам сначала нужно убедиться, что выполняются следующие условия, чтобы гарантировать, что наша проверка гипотезы будет достоверной:

  • Случайная выборка: для сбора данных для обеих выборок следует использовать случайную выборку или случайный эксперимент.
  • Нормальное: распределение выборки нормальное или приблизительно нормальное.
  • Независимость: две выборки независимы.

Если эти предположения выполняются, то мы можем провести проверку гипотезы.

Как узнать, когда использовать каждый тест

Вот краткий обзор каждого теста:

Тест хи-квадрат на независимость: позволяет проверить, существует ли статистически значимая связь между двумя категориальными переменными. Когда вы отвергаете нулевую гипотезу теста хи-квадрат на независимость, это означает, что между двумя переменными существует значительная связь.

Стьюдентный тест на разницу в средних значениях: позволяет проверить, существует ли статистически значимая разница между двумя средними значениями генеральной совокупности. Когда вы отклоняете нулевую гипотезу t-теста о разнице в средних, это означает, что две средние популяции не равны.

Самый простой способ узнать, использовать ли критерий хи-квадрат или t-критерий, — это просто посмотреть на типы переменных, с которыми вы работаете.

Если у вас есть две переменные, обе из которых являются категориальными, т. е. их можно отнести к таким категориям, как « мужской », « женский » и « республиканец », « демократ », « независимый », то вам следует использовать критерий хи-квадрат.

Но если одна переменная является категориальной (например, тип учебного плана — либо план 1, либо план 2), а другая — непрерывной (например, экзаменационный балл — измеряется от 0 до 100), то вам следует использовать t-критерий.

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.