Вы можете использовать proc tabulate в SAS для быстрого отображения описательной статистики для одной или нескольких переменных в табличном формате.
В следующих примерах показано, как использовать эту процедуру со следующим набором данных, который показывает общее количество очков, набранных 12 разными баскетболистами:
/\*create dataset\*/
data my_data;
input team $ position $ points;
datalines ;
A Guard 15
A Guard 12
A Guard 29
A Forward 13
A Forward 9
A Forward 16
B Guard 25
B Guard 20
C Guard 34
C Forward 19
C Forward 3
C Forward 8
;
run ;
/\*view dataset\*/
proc print data =my_data;
Пример 1: Proc Tabulate с одной переменной
Мы можем использовать следующий код для вычисления описательной статистики для переменной points:
/\*create table that displays descriptive stats for points variable \*/
proc tabulate data =my_data;
var points;
table points \* (N Min Q1 Median Mean Q3 Max);
run ;
Примечание.Значения в скобках сообщают SAS, какую описательную статистику следует вычислять для баллов.
Вот некоторые из наиболее часто используемых описательных статистик:
- N : общее количество наблюдений
- Мин : минимальное значение
- Q1 : Значение для первого квантиля (т.е. 25-го процентиля)
- Медиана : среднее значение
- Среднее значение: среднее значение
- Q3 : Значение для третьего квантиля (т.е. 75-го процентиля)
- Макс : максимальное значение
Из вывода мы видим:
- Всего наблюдений 12 .
- Минимальное значение баллов 3 .
- Количество баллов на 25-м процентиле равно 10,5 .
- Среднее количество баллов – 15,5 .
- Среднее количество баллов – 16,92 .
- Количество баллов на 75-м процентиле равно 22,5 .
- Максимальное количество баллов 34 .
Из этих пяти значений мы можем получить довольно хорошее представление о распределении значений переменной Weight.
Пример 2: Табулирование Proc с двумя переменными
Мы можем использовать следующий код для вычисления описательной статистики для переменной points, сгруппированной по переменной team:
/\*create table that displays descriptive stats for points, grouped by team \*/
proc tabulate data =my_data;
class team;
var points;
table team, points \* (N Min Q1 Median Mean Q3 Max);
run ;
Полученная таблица показывает описательную статистику очков для каждой из трех команд.
Например:
- Команда А имеет 6 наблюдений.
- Минимальное значение очков для команды А равно 9 .
- Количество очков у команды А на 25-м процентиле равно 12 .
- Среднее количество очков у команды А равно 14 .
И так далее.
Пример 3: Proc Tabulate с тремя переменными
Мы можем использовать следующий код для вычисления описательной статистики для переменной points, сгруппированной по переменным team и position:
/\*create table that shows descriptive stats for points, grouped by team and position \*/
proc tabulate data =my_data;
class team position;
var points;
table team, position \* points \* (N Min Q1 Median Mean Q3 Max);
run ;
Полученная таблица показывает описательную статистику по очкам, сгруппированную по командам и позициям.
Обратите внимание, что ячейки для команды «Б» и позиции «Нападающий» пусты, потому что в команде Б не было игроков с позицией «Нападающий».
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные задачи в SAS:
Как использовать сводку процедур в SAS
Как рассчитать корреляцию в SAS
Как создать частотные таблицы в SAS
Как создавать диаграммы по группам в SAS