Как использовать оператор тильды (~) в R


Вы можете использовать оператор тильды ( ~ ) в R, чтобы отделить левую часть уравнения от правой части.

Этот оператор чаще всего используется с функцией lm() в R, которая используется для подбора моделей линейной регрессии .

Основной синтаксис функции lm():

model <- lm(y ~ x1 + x2, data=df)

Имя переменной слева от оператора тильды (y) представляет переменную ответа .

Имена переменных справа от оператора тильды (x1, x2) представляют переменные- предикторы .

В следующих примерах показано, как использовать этот оператор тильды в различных сценариях.

Пример 1. Использование оператора тильды с одной переменной-предиктором

Предположим, мы подгоняем следующую простую модель линейной регрессии в R:

model <- lm(y ~ x, data=df)

Эта конкретная регрессионная модель имеет одну переменную ответа (y) и одну предикторную переменную (x).

Если мы запишем это уравнение регрессии в статистической записи, оно будет выглядеть так:

у = β 0 + β 1 х

Пример 2. Использование оператора тильды с несколькими переменными-предикторами

Предположим, мы подгоняем следующую модель множественной линейной регрессии в R:

model <- lm(y ~ x1 + x2 + x3, data=df)

Эта конкретная регрессионная модель имеет одну переменную отклика (y) и три переменные-предикторы (x1, x2, x3).

Если мы запишем это уравнение регрессии в статистической записи, оно будет выглядеть так:

у = β 0 + β 1 х 1 + β 2 х 2 + β 3 х 3

Пример 3. Использование оператора тильды с неизвестным количеством переменных-предикторов

Предположим, мы подгоняем следующую модель множественной линейной регрессии в R:

model <- lm(y ~ ., data=df)

Этот конкретный синтаксис указывает, что мы хотели бы использовать y в качестве переменной ответа и любую другую переменную во фрейме данных в качестве переменных-предикторов.

Этот синтаксис полезен, когда мы хотим подобрать регрессионную модель с множеством переменных-предикторов, но не хотим вводить индивидуальное имя каждой переменной-предиктора.

Дополнительные ресурсы

В следующих руководствах объясняется, как использовать другие распространенные функции в R:

Как использовать оператор знака доллара ($) в R
Как использовать оператор «НЕ В» в R
Как использовать оператор %in% в R

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.