Интерполяция и экстраполяция: в чем разница?

Интерполяция и экстраполяция: в чем разница?

В статистике студенты часто путают два термина: интерполяция и экстраполяция .

Вот разница:

Интерполяция относится к прогнозированию значений, которые находятся внутри диапазона точек данных.

Экстраполяция относится к прогнозированию значений, выходящих за пределы диапазона точек данных.

Следующий пример иллюстрирует разницу между двумя терминами.

Пример: интерполяция против экстраполяции

Предположим, у нас есть следующий набор данных:

Мы можем решить подогнать простую модель линейной регрессии к этим точкам:

Затем мы могли бы использовать подобранную регрессионную модель для прогнозирования значений точек как внутри , так и за пределами диапазона точек данных.

Когда мы используем подобранную регрессионную модель для прогнозирования значений точек внутри существующего диапазона точек данных, это называется интерполяцией.

И наоборот, когда мы используем подобранную регрессионную модель для прогнозирования значений точек за пределами существующего диапазона, это называется экстраполяцией :

Потенциальная опасность экстраполяции

Когда мы выполняем экстраполяцию, мы предполагаем, что та же закономерность, которая существует внутри текущего диапазона точек данных, существует и за его пределами.

Однако это может быть опасным предположением, поскольку вполне возможно, что шаблон, который существует за пределами текущего диапазона точек данных, совсем другой:

опасность экстраполяции

По этой причине может быть опасно использовать экстраполяцию для прогнозирования значений точек данных, выходящих за пределы диапазона значений, который использовался для построения регрессионной модели.

На практике часто можно использовать экстраполяцию для прогнозирования значений точек, которые лишь немного выходят за пределы диапазона существующих значений, но чем дальше за пределы диапазона, тем выше вероятность того, что разница между прогнозируемым значением и фактическим значением будет большой. .

Когда использовать экстраполяцию

Часто для определения того, является ли экстраполяция разумной идеей, требуется опыт в конкретной предметной области.

Например, предположим, что отдел маркетинга компании использует простую модель линейной регрессии, используя расходы на рекламу в качестве переменной-предиктора и общий доход в качестве переменной-отклика.

В этом сценарии разумно предположить, что постоянное увеличение расходов на рекламу приведет к предсказуемому увеличению общего дохода:

В этом сценарии мы можем быть вполне уверены в своей способности экстраполировать значения.

Однако рассмотрим сценарий, в котором биолог хочет использовать общее количество удобрений для прогнозирования роста растений.

Он может решить применить простую модель линейной регрессии к точкам данных, но поскольку существует верхний предел того, насколько высокими могут расти растения, вероятно, не имеет смысла использовать экстраполяцию для прогнозирования значений точек за пределами диапазона. значения, используемые для соответствия модели:

В этом сценарии мы можем быть значительно менее уверены в своей способности экстраполировать значения.

Вывод : Экстраполяция может иметь смысл в одних областях больше, чем в других, но всегда существует потенциальная опасность того, что шаблон, который существует в диапазоне значений, используемых для соответствия модели, не существует за пределами этого диапазона.

Дополнительные ресурсы

Как выполнить линейную интерполяцию в Excel
Как делать прогнозы с помощью линейной регрессии

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.