Минимальный размер выборки для t-критерия: объяснение и пример


Один из частых вопросов, который часто задают студенты:

Требуется ли минимальный размер выборки для проведения t-критерия?

Краткий ответ:

Нет. Для выполнения t-критерия не требуется минимального размера выборки.

Фактически, первый когда-либо выполненный t-тест использовал только размер выборки четыре .

Однако, если предположения t-критерия не выполняются, результаты могут быть ненадежными.

Кроме того, если размер выборки слишком мал, мощность теста может быть слишком низкой для обнаружения значимых различий в данных.

Давайте рассмотрим каждую из этих потенциальных проблем более подробно.

Понимание предположений t-тестов

Одновыборочный t-критерий используется для проверки того, равно ли среднее значение совокупности некоторому значению.

Этот тест делает следующие предположения:

  • Независимость : наблюдения в выборке должны быть независимыми.
  • Случайная выборка : наблюдения должны собираться с использованием метода случайной выборки, чтобы максимизировать шансы того, что выборка репрезентативна для интересующей совокупности.
  • Нормальность : Наблюдения должны быть примерно нормально распределены.

Двухвыборочный t-критерий используется для проверки того, существует ли значительная разница между двумя средними значениями генеральной совокупности.

Этот тест делает следующие предположения:

  • Независимость : наблюдения в каждой выборке должны быть независимыми.
  • Случайная выборка : наблюдения в каждой выборке должны быть собраны с использованием метода случайной выборки.
  • Нормальность : Каждый образец должен быть примерно нормально распределен.
  • Равная дисперсия : каждая выборка должна иметь примерно одинаковую дисперсию.

При выполнении каждого типа t-теста, если одно или несколько из этих предположений не выполняются, результаты теста могут стать ненадежными.

В этом случае лучше использовать непараметрический альтернативный тест, который не делает таких предположений.

Непараметрической альтернативой одновыборочному t-критерию является знаковый ранговый критерий Уилкоксона .

Непараметрической альтернативой двухвыборочному t-критерию является U-критерий Манна-Уитни .

Понимание силы t-тестов

Статистическая мощность относится к вероятности того, что тест обнаружит некоторый эффект, когда он действительно есть.

Можно показать, что чем меньше размер используемой выборки, тем ниже статистическая мощность данного теста. Вот почему исследователям обычно нужны выборки большего размера, чтобы они имели большую мощность и, следовательно, большую вероятность обнаружения истинных различий.

Например, предположим, что истинный размер эффекта между двумя популяциями равен 0,5 — «средний» размер эффекта. Мы можем использовать следующий R-код для вычисления мощности двухвыборочного t-критерия с использованием различных размеров выборки:

#sample size n=10
power. t.test (n=10, delta=.5, sd=1, sig.level=.05, type='two.sample')$power

[1] 0.1838375

#sample size n=30
power. t.test (n=30, delta=.5, sd=1, sig.level=.05, type='two.sample')$power

[1] 0.477841

#sample size n=50
power. t.test (n=50, delta=.5, sd=1, sig.level=.05, type='two.sample')$power

[1] 0.6968888

Вот как интерпретировать результаты:

  • Когда каждый размер выборки равен n = 10, мощность равна 0,184 .
  • Когда каждый размер выборки равен n = 30, мощность равна 0,478 .
  • Когда каждый размер выборки равен n = 50, мощность равна 0,697 .

Мы видим, что мощность теста увеличивается с увеличением размера выборки.

Таким образом, нам не нужен минимальный размер выборки для выполнения t-критерия, но небольшие размеры выборки приводят к меньшей статистической мощности и, следовательно, к снижению способности обнаруживать истинное различие в данных.

Вывод

Вот краткое изложение того, что мы узнали:

  • Для проведения t-критерия не требуется минимального размера выборки.
  • Если предположения t-критерия не выполняются, мы должны использовать непараметрическую альтернативу.
  • Если размер выборки слишком мал, мощность t-теста будет низкой, и способность теста обнаруживать истинные различия в данных будет низкой.

Дополнительные ресурсы

Следующие руководства предлагают дополнительную информацию о t-тестах.

Введение в одновыборочный t-критерий
Введение в двухвыборочный t-критерий
Введение в t-критерий парных выборок
Четыре предположения, сделанные в t-тесте

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.