Инструментальные переменные: определение и примеры

Инструментальные переменные: определение и примеры

Часто в статистике нас интересует оценка влияния одной переменной на другую. Например, возможно, мы хотим знать:

  • Как количество времени, потраченного на учебу, влияет на результаты экзаменов?
  • Как тот или иной препарат влияет на артериальное давление?
  • Как стресс влияет на частоту сердечных сокращений?

В каждом сценарии мы хотим понять, влияет ли какая-либо предикторная переменная на переменную ответа.Однако часто будут другие переменные, которые влияют на взаимосвязь между двумя переменными.

Например, предположим, что мы используем определенное лекарство в качестве переменной-предиктора и кровяное давление в качестве переменной-ответа. Нас интересует только влияние препарата на артериальное давление:

Однако другие переменные, такие как время, затраченное на тренировки, общее питание и уровень стресса, также влияют на кровяное давление:

Таким образом, если мы запустим простую линейную регрессию , используя лекарство в качестве переменной-предиктора и артериальное давление в качестве переменной отклика, мы не можем быть уверены, что коэффициенты регрессии точно отражают эффект, который лекарство оказывает на артериальное давление, поскольку внешние факторы ( упражнения, диета, стресс и т. д.) также могут играть роль.

Один из потенциальных способов обойти эту проблему — использовать инструментальную переменную .

Что такое инструментальная переменная?

Инструментальная переменная — это третья переменная, введенная в регрессионный анализ, которая коррелирует с предикторной переменной, но не коррелирует с переменной отклика. Используя эту переменную, становится возможным оценить истинный причинный эффект, который некоторая предикторная переменная оказывает на переменную отклика.

Например, предположим, что мы хотим оценить влияние определенного лекарства на кровяное давление:

Примером инструментальной переменной, которую мы можем использовать в этом регрессионном анализе, является близость человека к аптеке.

Эта переменная «близость», вероятно, будет сильно коррелировать с тем, принимает ли человек определенное лекарство, потому что человек не сможет получить его, если он не живет рядом с аптекой.

Однако ожидается, что переменная «близость» не будет иметь какой-либо корреляции с артериальным давлением. Единственная связь, которую он может иметь с артериальным давлением, — это предикторная переменная.

Инструментальная переменная

На самом деле мы используем инструментальную переменную через регрессию инструментальных переменных, иногда называемую двухэтапной регрессией наименьших квадратов .

Регрессия инструментальных переменных

Регрессия инструментальных переменных (или двухэтапная регрессия методом наименьших квадратов) использует следующий подход для оценки влияния предикторной переменной на переменную отклика:

Этап 1: Подберите регрессионную модель, используя инструментальную переменную в качестве переменной-предиктора.

В нашем конкретном примере мы сначала подогнали бы следующую модель регрессии:

Определенный наркотик = B 0 + B 1 (близость)

Тогда у нас останутся предсказанные значения для определенного препарата (cd), которые мы назовем cd hat .

Этап 2: Подберите вторую модель регрессии, используя предсказанные значения для cd hat .

Далее мы подгоним следующую модель регрессии:

Артериальное давление = B 0 + B 1 (кд шапка )

Если коэффициент регрессии для кд хат окажется статистически значимым, то можно будет говорить о наличии причинно-следственного влияния препарата на АД.

Причина, по которой мы можем сказать это, заключается в том, что мы использовали исключительно «близость», чтобы придумать компакт- диск , и поскольку мы знаем, что близость не должна коррелировать с кровяным давлением, любая значительная корреляция на втором этапе регрессии может быть приписана определенному препарату.

Предостережения по использованию инструментальных переменных

Инструментальную переменную следует использовать только в том случае, если она соответствует следующим критериям:

  • Он сильно коррелирует с предикторной переменной.
  • Это не коррелирует с переменной ответа.
  • Он не коррелирует с другими переменными, не включенными в модель (например, близость не коррелирует с физическими упражнениями, диетой или стрессом).

Если инструментальная переменная не соответствует этому критерию, ее не следует использовать в регрессионной модели, поскольку она, скорее всего, даст ненадежные и необъективные результаты.

Бонус: видеообъяснение инструментальных переменных

Следующее видео Эшли Ходжсон дает отличное визуальное объяснение инструментальных переменных:

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.