Как создать частотные таблицы в SAS (с примерами)


Вы можете использовать proc freq в SAS для быстрого создания частотных таблиц для одной или нескольких переменных в наборе данных.

В следующих примерах показано, как использовать эту процедуру со встроенным набором данных SAS под названием BirthWgt , который содержит различные характеристики для 100 000 недавно родивших матерей.

Мы можем использовать proc print для просмотра первых 10 наблюдений из этого набора данных:

/\*view first 10 observations from *BirthWgt* dataset\*/
proc print data =sashelp.BirthWgt ( obs = 10 );

run ;

Пример 1: Таблица частот для одной переменной

Мы можем использовать следующий код для создания таблицы частот для переменной Race:

/\*create frequency table for Race variable\*/
proc freq data =sashelp.BirthWgt;
 tables Race;
run ; 

Выходная таблица содержит четыре столбца:

  • Частота : общее количество наблюдений, попавших в определенную категорию.
  • Процент : процент от общего числа наблюдений, попавших в определенную категорию.
  • Кумулятивная частота : общее количество учтенных наблюдений до текущей строки включительно.
  • Совокупный процент : совокупный процент от общего числа наблюдений, которые были учтены до текущей строки включительно.

Например, из выходной таблицы мы можем увидеть:

  • Общее количество латиноамериканских матерей составило 22 139 человек .
  • Процент от общего числа матерей латиноамериканского происхождения составил 22,14% .
  • Общее количество матерей азиатского, черного или латиноамериканского происхождения составило 41 496 человек .
  • Совокупный процент матерей азиатского, черного или латиноамериканского происхождения составил 41,50% .

Пример 2: Таблица частот для одной переменной (отсортировано)

По умолчанию таблицы частот сортируются в алфавитном порядке на основе названий категорий. Однако вместо этого мы можем использовать функцию порядка для сортировки категорий по частоте:

/\*create frequency table for Race variable, sorted by frequency\*/
proc freq data =sashelp.BirthWgt order =freq;
 tables Race;
run ; 

Обратите внимание, что категории теперь отсортированы по частоте от самой высокой до самой низкой.

Пример 3: Таблица частот для одной переменной (включая пропущенные значения)

По умолчанию отсутствующие значения не включаются в таблицы частот.

Однако мы можем использовать недостающую команду, чтобы указать SAS включить строку для подсчета частоты пропущенных значений:

/\*create frequency table for Race variable, sorted by frequency\*/
proc freq data =sashelp.BirthWgt order =freq;
 tables Race / missing;
run ; 

Поскольку в таблицу частот не добавлялась дополнительная строка, это говорит нам о том, что в исходном наборе данных не было пропущенных значений для расы.

Пример 4: Таблица частот для нескольких переменных

Чтобы создать таблицу частот сразу для нескольких переменных, мы можем просто включить несколько имен переменных в аргумент таблицы .

Например, мы можем использовать следующий код для создания таблицы частот для расы и возрастной группы:

/\*create frequency table for Race and AgeGroup variables, both sorted by frequency\*/
proc freq data =sashelp.BirthWgt order =freq;
 tables Race AgeGroup;
run ; 

Мы видим, что таблица частот была создана для обеих переменных.