Как выполнить множественную линейную регрессию в Stata

Как выполнить множественную линейную регрессию в Stata

Множественная линейная регрессия — это метод, который можно использовать для понимания взаимосвязи между несколькими независимыми переменными и переменной отклика.

В этом руководстве объясняется, как выполнить множественную линейную регрессию в Stata.

Пример: множественная линейная регрессия в Stata

Предположим, мы хотим знать, влияют ли мили на галлон и вес на цену автомобиля. Чтобы проверить это, мы можем выполнить множественную линейную регрессию, используя мили на галлон и вес в качестве двух независимых переменных и цену в качестве переменной отклика.

Выполните следующие шаги в Stata, чтобы провести множественную линейную регрессию с использованием набора данных auto , который содержит данные о 74 различных автомобилях.

Шаг 1: Загрузите данные.

Загрузите данные, введя следующее в поле Command:

используйте http://www.stata-press.com/data/r13/auto

Шаг 2: Получите сводку данных.

Чтобы быстро понять данные, с которыми вы работаете, введите следующее в поле «Команда»:

подвести итог
Обобщение данных в Stata

Мы видим, что в наборе данных есть 12 различных переменных, но нас интересуют только mpg , weight и price .

Мы можем увидеть следующую основную сводную статистику по этим трем переменным:

цена | среднее значение = 6 165 долларов США, минимум = 3 291 доллар США, максимум 15 906 долларов США.

миль на галлон | среднее = 21,29, минимум = 12, максимум = 41

вес | среднее = 3019 фунтов, минимальное = 1760 фунтов, максимальное = 4840 фунтов

Шаг 3: Выполните множественную линейную регрессию.

Введите следующее в поле «Команда», чтобы выполнить множественную линейную регрессию, используя мили на галлон и вес в качестве независимых переменных и цену в качестве переменной ответа.

регресс цена миль на галлон вес
Вывод множественной регрессии в Stata

Вот как интерпретировать наиболее интересные числа в выводе:

Вероятность > F: 0,000. Это p-значение для общей регрессии. Поскольку это значение меньше 0,05, это указывает на то, что объединенные независимые переменные миль на галлон и веса имеют статистически значимую связь с ценой переменной отклика.

R-квадрат: 0,2934. Это доля дисперсии переменной отклика, которая может быть объяснена независимыми переменными. В этом примере 29,34% изменения цены можно объяснить расходом топлива и весом.

Коэффициент (миль на галлон): -49,512. Это говорит нам о среднем изменении цены, связанном с увеличением расхода топлива на одну единицу при условии, что вес остается постоянным.В этом примере увеличение на одну единицу миль на галлон связано со средним снижением цены примерно на 49,51 доллара при условии, что вес остается постоянным.

Например, предположим, что автомобили A и B весят 2000 фунтов. Если расход автомобиля А составляет 20 миль на галлон, а автомобиля В — только 19 миль на галлон, мы ожидаем, что цена автомобиля А будет на 49,51 доллара меньше, чем цена автомобиля В.

Р>|т| (миль на галлон): 0,567. Это p-значение, связанное со статистикой теста для миль на галлон. Поскольку это значение составляет не менее 0,05, у нас нет оснований говорить о статистически значимой связи мили на галлон с ценой.

Коэффициент (вес): 1,746. Это говорит нам о среднем изменении цены, которое связано с увеличением веса на одну единицу, при условии, что миля на галлон остается неизменной.В этом примере каждое увеличение веса на одну единицу связано со средним увеличением цены примерно на 1,74 доллара, при условии, что миля на галлон остается неизменной.

Например, предположим, что автомобили A и B расходуют по 20 миль на галлон. Если автомобиль A весит на один фунт больше, чем автомобиль B, то ожидается, что автомобиль A будет стоить на 1,74 доллара больше.

Р>|т| (вес): 0,008. Это p-значение, связанное со статистикой теста для веса. Поскольку это значение меньше 0,05, у нас есть достаточно доказательств, чтобы сказать, что вес имеет статистически значимую связь с ценой.

Коэф (_cons): 1946.069. Это говорит нам о средней цене автомобиля, когда и мили на галлон, и вес равны нулю. В этом примере средняя цена составляет 1946 долларов США, когда и вес, и мили на галлон равны нулю. На самом деле это не имеет особого смысла интерпретировать, поскольку вес и расход автомобиля не могут быть равны нулю, но число 1946,069 необходимо для формирования уравнения регрессии.

Шаг 4: Сообщите о результатах.

Наконец, мы хотим сообщить о результатах нашей множественной линейной регрессии. Вот пример того, как это сделать:

Множественная линейная регрессия была выполнена для количественной оценки взаимосвязи между весом и расходом топлива на галлон автомобиля и его ценой. Для анализа использовалась выборка из 74 автомобилей.
Результаты показали, что существует статистически значимая связь между весом и ценой (t = 2,72, p = 0,008), но не было статистически значимой связи между милями на галлон и ценой (и милями на галлон (t = -0,57, p = 0,567)). .
Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.