Как использовать Proc Tabulate в SAS (с примерами)


Вы можете использовать proc tabulate в SAS для быстрого отображения описательной статистики для одной или нескольких переменных в табличном формате.

В следующих примерах показано, как использовать эту процедуру со следующим набором данных, который показывает общее количество очков, набранных 12 разными баскетболистами:

/\*create dataset\*/
data my_data;
 input team $ position $ points;
 datalines ;
A Guard 15
A Guard 12
A Guard 29
A Forward 13
A Forward 9
A Forward 16
B Guard 25
B Guard 20
C Guard 34
C Forward 19
C Forward 3
C Forward 8
;
run ;

/\*view dataset\*/
proc print data =my_data;

Пример 1: Proc Tabulate с одной переменной

Мы можем использовать следующий код для вычисления описательной статистики для переменной points:

/\*create table that displays descriptive stats for points variable \*/
proc tabulate data =my_data;
 var points;
 table points \* (N Min Q1 Median Mean Q3 Max);
run ; 

Примечание.Значения в скобках сообщают SAS, какую описательную статистику следует вычислять для баллов.

Вот некоторые из наиболее часто используемых описательных статистик:

  • N : общее количество наблюдений
  • Мин : минимальное значение
  • Q1 : Значение для первого квантиля (т.е. 25-го процентиля)
  • Медиана : среднее значение
  • Среднее значение: среднее значение
  • Q3 : Значение для третьего квантиля (т.е. 75-го процентиля)
  • Макс : максимальное значение

Из вывода мы видим:

  • Всего наблюдений 12 .
  • Минимальное значение баллов 3 .
  • Количество баллов на 25-м процентиле равно 10,5 .
  • Среднее количество баллов – 15,5 .
  • Среднее количество баллов – 16,92 .
  • Количество баллов на 75-м процентиле равно 22,5 .
  • Максимальное количество баллов 34 .

Из этих пяти значений мы можем получить довольно хорошее представление о распределении значений переменной Weight.

Пример 2: Табулирование Proc с двумя переменными

Мы можем использовать следующий код для вычисления описательной статистики для переменной points, сгруппированной по переменной team:

/\*create table that displays descriptive stats for points, grouped by team \*/
proc tabulate data =my_data;
 class team;
 var points;
 table team, points \* (N Min Q1 Median Mean Q3 Max);
run ; 

Полученная таблица показывает описательную статистику очков для каждой из трех команд.

Например:

  • Команда А имеет 6 наблюдений.
  • Минимальное значение очков для команды А равно 9 .
  • Количество очков у команды А на 25-м процентиле равно 12 .
  • Среднее количество очков у команды А равно 14 .

И так далее.

Пример 3: Proc Tabulate с тремя переменными

Мы можем использовать следующий код для вычисления описательной статистики для переменной points, сгруппированной по переменным team и position:

/\*create table that shows descriptive stats for points, grouped by team and position \*/
proc tabulate data =my_data;
 class team position;
 var points;
 table team, position \* points \* (N Min Q1 Median Mean Q3 Max);
run ; 

Полученная таблица показывает описательную статистику по очкам, сгруппированную по командам и позициям.

Обратите внимание, что ячейки для команды «Б» и позиции «Нападающий» пусты, потому что в команде Б не было игроков с позицией «Нападающий».

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные задачи в SAS:

Как использовать сводку процедур в SAS
Как рассчитать корреляцию в SAS
Как создать частотные таблицы в SAS
Как создавать диаграммы по группам в SAS