Вы можете использовать сводку proc в SAS, чтобы быстро вычислить следующую описательную статистику для одной или нескольких переменных в наборе данных:
- N : общее количество наблюдений
- МИН : минимальное значение
- МАКС : максимальное значение
- ЗНАЧЕНИЕ : среднее значение
- STD : стандартное отклонение
В следующих примерах показано, как использовать эту процедуру со встроенным набором данных SAS под названием Fish , который содержит различные измерения для 159 различных рыб, пойманных в озере в Финляндии.
Мы можем использовать proc print для просмотра первых 10 наблюдений из этого набора данных:
/\*view first 10 observations from *Fish* dataset\*/
proc print data =sashelp.Fish ( obs = 10 );
run ;

Связанный: Как определить выбросы в SAS
Пример 1: сводка процесса с одной переменной
Мы можем использовать следующий код для вычисления описательной статистики для переменной Weight:
/\*calculate descriptive statistics for Weight variable\*/
proc summary data =sashelp.Fish;
var Weight ;
output out =summaryWeight;
run ;
/\*print output dataset\*/
proc print data =summaryWeight;

Вот как интерпретировать выходную таблицу:
- _TYPE_: в этом столбце показано, использовалась ли каждая строка в наборе данных для расчета описательной статистики. 0 = использовалась каждая строка.
- _FREQ_: количество строк, используемых для расчета каждой описательной статистики.
- _STAT_: имя описательной статистики.
- Вес: числовое значение соответствующей описательной статистики.
Из вывода мы видим:
- Общее количество наблюдений составило 158 .
- Минимальное значение веса равно 0 .
- Максимальное значение веса составляло 1650 .
- Среднее значение веса составило 398,70 .
- Стандартное отклонение значений веса составило 359,09 .
Из этих пяти значений мы можем получить довольно хорошее представление о распределении значений переменной Weight.
Пример 2: сводка процесса с несколькими переменными
Чтобы вычислить описательную статистику сразу для нескольких переменных, просто укажите несколько имен переменных в операторе var .
Например, мы можем использовать следующий код для расчета описательной статистики для переменных веса и роста:
/\*calculate descriptive statistics for Weight and Height variables\*/
proc summary data =sashelp.Fish;
var Weight Height ;
output out =summaryWeightHeight;
run ;
/\*print output dataset\*/
proc print data =summaryWeightHeight;

Из вывода мы можем увидеть пять описательных статистик для веса и роста.
Пример 3: сводка процесса с одной переменной, сгруппированной с другой переменной
Чтобы вычислить описательную статистику для одной переменной, сгруппированной по другой переменной, мы можем использовать оператор класса .
Например, мы можем использовать следующий код для расчета описательной статистики для веса, сгруппированного по видам:
/\*calculate descriptive statistics for Weight grouped by Species\*/
proc summary data =sashelp.Fish;
var Weight ;
class Species;
output out =summaryWeightSpecies;
run ;
/\*print output dataset\*/
proc print data =summaryWeightSpecies;

Выходная таблица отображает описательную статистику для каждого вида рыб.
Например, мы можем наблюдать следующую описательную статистику только для рыбы Лещ:
- Общее количество наблюдений составило 34 .
- Минимальное значение веса было 242 .
- Максимальное значение веса составляло 1000 .
- Среднее значение веса составило 626 .
- Стандартное отклонение значений веса составило 206,60 .
Мы можем наблюдать эту описательную статистику и для любого другого вида.
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные задачи в SAS:
Как использовать Proc Append в SAS
Как использовать Proc Tabulate в SAS
Как рассчитать корреляцию в SAS
Как создать частотные таблицы в SAS