Как использовать Proc Tabulate в SAS (с примерами)

Как использовать Proc Tabulate в SAS (с примерами)

Вы можете использовать proc tabulate в SAS для быстрого отображения описательной статистики для одной или нескольких переменных в табличном формате.

В следующих примерах показано, как использовать эту процедуру со следующим набором данных, который показывает общее количество очков, набранных 12 разными баскетболистами:

/\*create dataset\*/
data my_data;
 input team $ position $ points;
 datalines ;
A Guard 15
A Guard 12
A Guard 29
A Forward 13
A Forward 9
A Forward 16
B Guard 25
B Guard 20
C Guard 34
C Forward 19
C Forward 3
C Forward 8
;
run ;

/\*view dataset\*/
proc print data =my_data;

Пример 1: Proc Tabulate с одной переменной

Мы можем использовать следующий код для вычисления описательной статистики для переменной points:

/\*create table that displays descriptive stats for points variable \*/
proc tabulate data =my_data;
 var points;
 table points \* (N Min Q1 Median Mean Q3 Max);
run ; 

Примечание.Значения в скобках сообщают SAS, какую описательную статистику следует вычислять для баллов.

Вот некоторые из наиболее часто используемых описательных статистик:

  • N : общее количество наблюдений
  • Мин : минимальное значение
  • Q1 : Значение для первого квантиля (т.е. 25-го процентиля)
  • Медиана : среднее значение
  • Среднее значение: среднее значение
  • Q3 : Значение для третьего квантиля (т.е. 75-го процентиля)
  • Макс : максимальное значение

Из вывода мы видим:

  • Всего наблюдений 12 .
  • Минимальное значение баллов 3 .
  • Количество баллов на 25-м процентиле равно 10,5 .
  • Среднее количество баллов – 15,5 .
  • Среднее количество баллов – 16,92 .
  • Количество баллов на 75-м процентиле равно 22,5 .
  • Максимальное количество баллов 34 .

Из этих пяти значений мы можем получить довольно хорошее представление о распределении значений переменной Weight.

Пример 2: Табулирование Proc с двумя переменными

Мы можем использовать следующий код для вычисления описательной статистики для переменной points, сгруппированной по переменной team:

/\*create table that displays descriptive stats for points, grouped by team \*/
proc tabulate data =my_data;
 class team;
 var points;
 table team, points \* (N Min Q1 Median Mean Q3 Max);
run ; 

Полученная таблица показывает описательную статистику очков для каждой из трех команд.

Например:

  • Команда А имеет 6 наблюдений.
  • Минимальное значение очков для команды А равно 9 .
  • Количество очков у команды А на 25-м процентиле равно 12 .
  • Среднее количество очков у команды А равно 14 .

И так далее.

Пример 3: Proc Tabulate с тремя переменными

Мы можем использовать следующий код для вычисления описательной статистики для переменной points, сгруппированной по переменным team и position:

/\*create table that shows descriptive stats for points, grouped by team and position \*/
proc tabulate data =my_data;
 class team position;
 var points;
 table team, position \* points \* (N Min Q1 Median Mean Q3 Max);
run ; 

Полученная таблица показывает описательную статистику по очкам, сгруппированную по командам и позициям.

Обратите внимание, что ячейки для команды «Б» и позиции «Нападающий» пусты, потому что в команде Б не было игроков с позицией «Нападающий».

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные задачи в SAS:

Как использовать сводку процедур в SAS
Как рассчитать корреляцию в SAS
Как создать частотные таблицы в SAS
Как создавать диаграммы по группам в SAS

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.