Когда два набора данных имеют одинаковую длину и каждое наблюдение в одном наборе данных может быть «спарено» с наблюдением в другом наборе данных, мы называем это парными данными .
Для объединения двух наборов данных важно, чтобы каждое наблюдение в одном наборе данных могло быть связано только с одним наблюдением в другом наборе данных.
Примеры парных данных
Вот несколько примеров парных данных:
Пример 1: Повторные измерения.
Предположим, исследователи хотят знать, постоянны ли весы при взвешивании ящиков в любое время дня на определенном складе. Чтобы проверить это, исследователи взвешивают на весах 30 различных коробок утром и вечером.
Конечным результатом являются два набора данных, в которых утренний и вечерний вес каждой коробки можно «сопоставить» друг с другом.
Пример 2: Измерения до и после.
Врач хочет знать, способен ли новый препарат снижать кровяное давление у пациентов. Чтобы проверить это, он измеряет кровяное давление у 20 разных пациентов до и после приема препарата в течение одной недели.
Конечным результатом являются два набора данных, в которых артериальное давление каждого человека до и после может быть «сопоставлено» друг с другом.
Как анализировать парные данные
Существует два распространенных способа анализа парных данных:
1. Выполните парный t-тест.
Одним из способов анализа парных данных является выполнение t-критерия для парных выборок , который сравнивает средние значения двух выборок, когда каждое наблюдение в одной выборке может быть сопоставлено с наблюдением в другой выборке.
Этот тест говорит нам, равно ли среднее значение между двумя наборами данных.
2. Рассчитайте корреляцию между двумя наборами данных.
Другой способ анализа парных данных — вычислитькорреляцию между двумя наборами данных.
Это дает нам представление о направлении и силе взаимосвязи между значениями в двух наборах данных.
Парные данные против непарных данных
В отличие от парных данных, непарные данные возникают, когда наблюдения одного набора данных не могут быть однозначно связаны с наблюдениями в другом наборе данных.
Например, предположим, что исследователи хотят знать, увеличивает ли определенная тренировочная программа средний вертикальный прыжок баскетболистов.
Один из способов проверить это с помощью парных данных — измерить максимальный вертикальный прыжок тех же 20 игроков до и после использования тренировочной программы:
Чтобы проверить это, используя непарные данные , исследователи могли измерить максимальный вертикальный прыжок 20 игроков, которые не использовали тренировочную программу, а затем измерить максимальный вертикальный прыжок 20 разных игроков, которые использовали тренировочную программу:
Когда мы работаем с парными данными, мы используем t-критерий парных выборок, чтобы определить, отличается ли разница между выборочными средними.
А когда мы работаем с непарными данными, мы используем t-тест для независимых выборок, чтобы определить, отличается ли разница между выборочными средними.