Как создать частотные таблицы в SAS (с примерами)

Как создать частотные таблицы в SAS (с примерами)

Вы можете использовать proc freq в SAS для быстрого создания частотных таблиц для одной или нескольких переменных в наборе данных.

В следующих примерах показано, как использовать эту процедуру со встроенным набором данных SAS под названием BirthWgt , который содержит различные характеристики для 100 000 недавно родивших матерей.

Мы можем использовать proc print для просмотра первых 10 наблюдений из этого набора данных:

/\*view first 10 observations from *BirthWgt* dataset\*/
proc print data =sashelp.BirthWgt ( obs = 10 );

run ;

Пример 1: Таблица частот для одной переменной

Мы можем использовать следующий код для создания таблицы частот для переменной Race:

/\*create frequency table for Race variable\*/
proc freq data =sashelp.BirthWgt;
 tables Race;
run ; 
таблица частот в SAS

Выходная таблица содержит четыре столбца:

  • Частота : общее количество наблюдений, попавших в определенную категорию.
  • Процент : процент от общего числа наблюдений, попавших в определенную категорию.
  • Кумулятивная частота : общее количество учтенных наблюдений до текущей строки включительно.
  • Совокупный процент : совокупный процент от общего числа наблюдений, которые были учтены до текущей строки включительно.

Например, из выходной таблицы мы можем увидеть:

  • Общее количество латиноамериканских матерей составило 22 139 человек .
  • Процент от общего числа матерей латиноамериканского происхождения составил 22,14% .
  • Общее количество матерей азиатского, черного или латиноамериканского происхождения составило 41 496 человек .
  • Совокупный процент матерей азиатского, черного или латиноамериканского происхождения составил 41,50% .

Пример 2: Таблица частот для одной переменной (отсортировано)

По умолчанию таблицы частот сортируются в алфавитном порядке на основе названий категорий. Однако вместо этого мы можем использовать функцию порядка для сортировки категорий по частоте:

/\*create frequency table for Race variable, sorted by frequency\*/
proc freq data =sashelp.BirthWgt order =freq;
 tables Race;
run ; 

Обратите внимание, что категории теперь отсортированы по частоте от самой высокой до самой низкой.

Пример 3: Таблица частот для одной переменной (включая пропущенные значения)

По умолчанию отсутствующие значения не включаются в таблицы частот.

Однако мы можем использовать недостающую команду, чтобы указать SAS включить строку для подсчета частоты пропущенных значений:

/\*create frequency table for Race variable, sorted by frequency\*/
proc freq data =sashelp.BirthWgt order =freq;
 tables Race / missing;
run ; 

Поскольку в таблицу частот не добавлялась дополнительная строка, это говорит нам о том, что в исходном наборе данных не было пропущенных значений для расы.

Пример 4: Таблица частот для нескольких переменных

Чтобы создать таблицу частот сразу для нескольких переменных, мы можем просто включить несколько имен переменных в аргумент таблицы .

Например, мы можем использовать следующий код для создания таблицы частот для расы и возрастной группы:

/\*create frequency table for Race and AgeGroup variables, both sorted by frequency\*/
proc freq data =sashelp.BirthWgt order =freq;
 tables Race AgeGroup;
run ; 

Мы видим, что таблица частот была создана для обеих переменных.

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.