Как использовать сводку процедур в SAS (с примерами)


Вы можете использовать сводку proc в SAS, чтобы быстро вычислить следующую описательную статистику для одной или нескольких переменных в наборе данных:

  • N : общее количество наблюдений
  • МИН : минимальное значение
  • МАКС : максимальное значение
  • ЗНАЧЕНИЕ : среднее значение
  • STD : стандартное отклонение

В следующих примерах показано, как использовать эту процедуру со встроенным набором данных SAS под названием Fish , который содержит различные измерения для 159 различных рыб, пойманных в озере в Финляндии.

Мы можем использовать proc print для просмотра первых 10 наблюдений из этого набора данных:

/\*view first 10 observations from *Fish* dataset\*/
proc print data =sashelp.Fish ( obs = 10 );

run ;

Связанный: Как определить выбросы в SAS

Пример 1: сводка процесса с одной переменной

Мы можем использовать следующий код для вычисления описательной статистики для переменной Weight:

/\*calculate descriptive statistics for Weight variable\*/
proc summary data =sashelp.Fish;
 var Weight ;
 output out =summaryWeight;
run ;

/\*print output dataset\*/
proc print data =summaryWeight; 

Вот как интерпретировать выходную таблицу:

  • _TYPE_: в этом столбце показано, использовалась ли каждая строка в наборе данных для расчета описательной статистики. 0 = использовалась каждая строка.
  • _FREQ_: количество строк, используемых для расчета каждой описательной статистики.
  • _STAT_: имя описательной статистики.
  • Вес: числовое значение соответствующей описательной статистики.

Из вывода мы видим:

  • Общее количество наблюдений составило 158 .
  • Минимальное значение веса равно 0 .
  • Максимальное значение веса составляло 1650 .
  • Среднее значение веса составило 398,70 .
  • Стандартное отклонение значений веса составило 359,09 .

Из этих пяти значений мы можем получить довольно хорошее представление о распределении значений переменной Weight.

Пример 2: сводка процесса с несколькими переменными

Чтобы вычислить описательную статистику сразу для нескольких переменных, просто укажите несколько имен переменных в операторе var .

Например, мы можем использовать следующий код для расчета описательной статистики для переменных веса и роста:

/\*calculate descriptive statistics for Weight and Height variables\*/
proc summary data =sashelp.Fish;
 var Weight Height ;
 output out =summaryWeightHeight;
run ;

/\*print output dataset\*/
proc print data =summaryWeightHeight; 

Из вывода мы можем увидеть пять описательных статистик для веса и роста.

Пример 3: сводка процесса с одной переменной, сгруппированной с другой переменной

Чтобы вычислить описательную статистику для одной переменной, сгруппированной по другой переменной, мы можем использовать оператор класса .

Например, мы можем использовать следующий код для расчета описательной статистики для веса, сгруппированного по видам:

/\*calculate descriptive statistics for Weight grouped by Species\*/
proc summary data =sashelp.Fish;
 var Weight ;
 class Species;
 output out =summaryWeightSpecies;
run ;

/\*print output dataset\*/
proc print data =summaryWeightSpecies; 

Выходная таблица отображает описательную статистику для каждого вида рыб.

Например, мы можем наблюдать следующую описательную статистику только для рыбы Лещ:

  • Общее количество наблюдений составило 34 .
  • Минимальное значение веса было 242 .
  • Максимальное значение веса составляло 1000 .
  • Среднее значение веса составило 626 .
  • Стандартное отклонение значений веса составило 206,60 .

Мы можем наблюдать эту описательную статистику и для любого другого вида.

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные задачи в SAS:

Как использовать Proc Append в SAS
Как использовать Proc Tabulate в SAS
Как рассчитать корреляцию в SAS
Как создать частотные таблицы в SAS