Вы можете использовать proc freq в SAS для быстрого создания частотных таблиц для одной или нескольких переменных в наборе данных.
В следующих примерах показано, как использовать эту процедуру со встроенным набором данных SAS под названием BirthWgt , который содержит различные характеристики для 100 000 недавно родивших матерей.
Мы можем использовать proc print для просмотра первых 10 наблюдений из этого набора данных:
/\*view first 10 observations from *BirthWgt* dataset\*/
proc print data =sashelp.BirthWgt ( obs = 10 );
run ;
Пример 1: Таблица частот для одной переменной
Мы можем использовать следующий код для создания таблицы частот для переменной Race:
/\*create frequency table for Race variable\*/
proc freq data =sashelp.BirthWgt;
tables Race;
run ;
Выходная таблица содержит четыре столбца:
- Частота : общее количество наблюдений, попавших в определенную категорию.
- Процент : процент от общего числа наблюдений, попавших в определенную категорию.
- Кумулятивная частота : общее количество учтенных наблюдений до текущей строки включительно.
- Совокупный процент : совокупный процент от общего числа наблюдений, которые были учтены до текущей строки включительно.
Например, из выходной таблицы мы можем увидеть:
- Общее количество латиноамериканских матерей составило 22 139 человек .
- Процент от общего числа матерей латиноамериканского происхождения составил 22,14% .
- Общее количество матерей азиатского, черного или латиноамериканского происхождения составило 41 496 человек .
- Совокупный процент матерей азиатского, черного или латиноамериканского происхождения составил 41,50% .
Пример 2: Таблица частот для одной переменной (отсортировано)
По умолчанию таблицы частот сортируются в алфавитном порядке на основе названий категорий. Однако вместо этого мы можем использовать функцию порядка для сортировки категорий по частоте:
/\*create frequency table for Race variable, sorted by frequency\*/
proc freq data =sashelp.BirthWgt order =freq;
tables Race;
run ;
Обратите внимание, что категории теперь отсортированы по частоте от самой высокой до самой низкой.
Пример 3: Таблица частот для одной переменной (включая пропущенные значения)
По умолчанию отсутствующие значения не включаются в таблицы частот.
Однако мы можем использовать недостающую команду, чтобы указать SAS включить строку для подсчета частоты пропущенных значений:
/\*create frequency table for Race variable, sorted by frequency\*/
proc freq data =sashelp.BirthWgt order =freq;
tables Race / missing;
run ;
Поскольку в таблицу частот не добавлялась дополнительная строка, это говорит нам о том, что в исходном наборе данных не было пропущенных значений для расы.
Пример 4: Таблица частот для нескольких переменных
Чтобы создать таблицу частот сразу для нескольких переменных, мы можем просто включить несколько имен переменных в аргумент таблицы .
Например, мы можем использовать следующий код для создания таблицы частот для расы и возрастной группы:
/\*create frequency table for Race and AgeGroup variables, both sorted by frequency\*/
proc freq data =sashelp.BirthWgt order =freq;
tables Race AgeGroup;
run ;
Мы видим, что таблица частот была создана для обеих переменных.