Вы можете использовать оператор тильды ( ~ ) в R, чтобы отделить левую часть уравнения от правой части.
Этот оператор чаще всего используется с функцией lm() в R, которая используется для подбора моделей линейной регрессии .
Основной синтаксис функции lm():
model <- lm(y ~ x1 + x2, data=df)
Имя переменной слева от оператора тильды (y) представляет переменную ответа .
Имена переменных справа от оператора тильды (x1, x2) представляют переменные- предикторы .
В следующих примерах показано, как использовать этот оператор тильды в различных сценариях.
Пример 1. Использование оператора тильды с одной переменной-предиктором
Предположим, мы подгоняем следующую простую модель линейной регрессии в R:
model <- lm(y ~ x, data=df)
Эта конкретная регрессионная модель имеет одну переменную ответа (y) и одну предикторную переменную (x).
Если мы запишем это уравнение регрессии в статистической записи, оно будет выглядеть так:
у = β 0 + β 1 х
Пример 2. Использование оператора тильды с несколькими переменными-предикторами
Предположим, мы подгоняем следующую модель множественной линейной регрессии в R:
model <- lm(y ~ x1 + x2 + x3, data=df)
Эта конкретная регрессионная модель имеет одну переменную отклика (y) и три переменные-предикторы (x1, x2, x3).
Если мы запишем это уравнение регрессии в статистической записи, оно будет выглядеть так:
у = β 0 + β 1 х 1 + β 2 х 2 + β 3 х 3
Пример 3. Использование оператора тильды с неизвестным количеством переменных-предикторов
Предположим, мы подгоняем следующую модель множественной линейной регрессии в R:
model <- lm(y ~ ., data=df)
Этот конкретный синтаксис указывает, что мы хотели бы использовать y в качестве переменной ответа и любую другую переменную во фрейме данных в качестве переменных-предикторов.
Этот синтаксис полезен, когда мы хотим подобрать регрессионную модель с множеством переменных-предикторов, но не хотим вводить индивидуальное имя каждой переменной-предиктора.
Дополнительные ресурсы
В следующих руководствах объясняется, как использовать другие распространенные функции в R:
Как использовать оператор знака доллара ($) в R
Как использовать оператор «НЕ В» в R
Как использовать оператор %in% в R