Критерий Колмогорова-Смирнова используется для определения нормальности распределения выборки.
Этот тест широко используется, потому что многие статистические тесты и процедуры предполагают , что данные распределены нормально.
В следующем пошаговом примере показано, как выполнить тест Колмогорова-Смирнова на образце набора данных в SAS.
Пример: Тест Колмогорова-Смирнова в SAS
Во-первых, давайте создадим набор данных в SAS с размером выборки n = 20:
/\*create dataset\*/
data my_data;
input Values;
datalines ;
5.57
8.32
8.35
8.74
8.75
9.38
9.91
9.96
10.36
10.65
10.77
10.97
11.15
11.18
11.47
11.64
11.88
12.24
13.02
13.19
;
run ;
Далее мы будем использовать proc univariate для выполнения теста Колмогорова-Смирнова, чтобы определить, нормально ли распределена выборка:
/\*perform Kolmogorov-Smirnov test\*/
proc univariate data =my_data;
histogram Values / normal ( mu =est sigma =est);
run ;
В нижней части вывода мы видим статистику теста и соответствующее значение p теста Колмогорова-Смирнова:

Статистика теста составляет 0,1098 , а соответствующее значение p > 0,150 .
Напомним, что тест Колмогорова-Смирнова использует следующие нулевую и альтернативную гипотезы:
- H 0 : Данные нормально распределены.
- H A : Данные не распределены нормально.
Поскольку p-значение теста не меньше 0,05, мы не можем отвергнуть нулевую гипотезу.
Это означает, что мы можем предположить, что набор данных нормально распределен.
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнить тест Колмогорова-Смирнова в другом статистическом программном обеспечении:
Как выполнить тест Колмогорова-Смирнова в Excel
Как выполнить тест Колмогорова-Смирнова в R
Как выполнить тест Колмогорова-Смирнова в Python