Вы можете использовать оператор datalines в SAS, чтобы быстро создать новый набор данных с нуля.
Для этого можно использовать следующий базовый синтаксис:
data original_data;
input var1 $ var2;
datalines ;
A 12
B 19
C 23
D 40
;
run ;
Вот что делает каждое выражение:
- data : имя набора данных
- input : имя и тип каждой переменной в наборе данных
- datalines : фактические значения в наборе данных
Обратите внимание, что знак доллара « $ » после имени переменной сообщает SAS, что эта переменная является символьной.
В следующих примерах показано, как использовать оператор datalines на практике.
Пример 1: создание набора данных со всеми числовыми переменными
В следующем коде показано, как создать набор данных с тремя числовыми переменными: очки, передачи и подборы:
/\*create dataset\*/
data original_data;
input points assists rebounds;
datalines ;
22 8 4
29 5 4
31 12 8
30 9 14
22 7 1
24 9 2
18 6 4
20 5 5
25 1 4
;
run ;
/\*view dataset\*/
proc print data =original_data;

Результатом является набор данных с тремя числовыми переменными.
Пример 2: *создание набора данных с символьными и числовыми переменными*
В следующем коде показано, как создать набор данных как с символьными, так и с числовыми переменными:
/\*create dataset\*/
data original_data;
input team $ position $ points assists;
datalines ;
A Guard 8 4
A Guard 5 4
A Forward 12 8
A Forward 9 14
A Forward 7 1
B Guard 9 2
B Guard 14 9
B Forward 15 8
B Forward 11 4
;
run ;
/\*view dataset\*/
proc print data =original_data;

Мы можем использовать функцию содержимого proc для проверки типа каждой переменной:
proc contents data =original_data;

Из вывода мы видим, что команда и позиция являются символьными переменными, а очки и передачи — числовыми переменными.
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные задачи в SAS:
Как создать новые переменные в SAS
Как заменить символы в строке в SAS
Как заменить пропущенные значения нулем в SAS
Как удалить дубликаты в SAS