Вы можете использовать операторы KEEP и DROP в SAS при создании нового набора данных, чтобы сохранить или удалить определенные переменные из существующего набора данных.
Эти операторы используют следующий основной синтаксис:
Способ 1: выберите, какие столбцы оставить
data new_data;
set original_data;
keep var1 var3;
run ;
Способ 2: выберите, какие столбцы удалить
data new_data;
set original_data;
drop var5;
run ;
В следующих примерах показано, как использовать каждый метод со следующим набором данных в SAS:
/\*create dataset\*/
data original_data;
input team $ points rebounds;
datalines ;
Warriors 25 8
Wizards 18 12
Rockets 22 6
Celtics 24 11
Thunder 27 14
Spurs 33 19
Nets 31 20
;
run ;
/\*view dataset\*/
proc print data =original_data;

Пример 1. Выберите, какие столбцы оставить
В следующем коде показано, как создать новый набор данных в SAS с помощью оператора KEEP , чтобы сохранить только переменные team и rebounds из исходного набора данных:
/\*create new dataset\*/
data new_data;
set original_data;
keep team rebounds;
run ;
/\*view new dataset\*/
proc print data =new_data;

Обратите внимание, что мы сохранили переменные team и rebounds из исходного набора данных, а все остальные переменные были просто удалены.
Пример 2: выберите, какие столбцы УДАЛИТЬ
В следующем коде показано, как создать новый набор данных в SAS с помощью оператора DROP , чтобы удалить переменную rebounds из исходного набора данных:
/\*create new dataset\*/
data new_data;
set original_data;
drop rebounds;
run ;
/\*view new dataset\*/
proc print data =new_data;

Обратите внимание, что переменная rebounds была удалена из набора данных, в то время как все остальные переменные из исходного набора данных были сохранены.
KEEP против DROP: какое утверждение следует использовать?
Операторы KEEP и DROP дают один и тот же результат: они оба позволяют создать новый набор данных, сохраняя или удаляя определенные переменные из существующего набора данных.
Обычно мы используем оператор KEEP , когда хотим сохранить только несколько переменных из исходного набора данных, так как это быстрее, чем вводить все переменные, которые мы хотели бы удалить.
И наоборот, мы обычно используем оператор DROP , когда хотим удалить только несколько переменных из исходного набора данных, поскольку это быстрее, чем вводить все переменные, которые мы хотели бы сохранить.
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные задачи в SAS:
Как переименовать переменные в SAS
Как создать новые переменные в SAS
Как заменить символы в строке в SAS