Как создавать и изменять диаграммы рассеяния в Stata

Как создавать и изменять диаграммы рассеяния в Stata

Диаграмма рассеяния — это тип графика, который мы можем использовать для отображения взаимосвязи между двумя переменными. Это помогает нам визуализировать как направление (положительное или отрицательное), так и силу (слабая, умеренная, сильная) взаимосвязи между двумя переменными.

В этом руководстве объясняется, как создавать и изменять диаграммы рассеяния в Stata.

Как создать диаграммы рассеяния в Stata

Мы будем использовать набор данных с именем auto , чтобы проиллюстрировать, как создавать и изменять диаграммы рассеяния в Stata.

Сначала загрузите данные, введя следующее в поле «Команда»:

используйте http://www.stata-press.com/data/r13/auto

Мы можем быстро просмотреть набор данных, введя следующее в поле «Команда»:

подвести итог
Обобщить пример команды в Stata

Мы видим, что всего в наборе данных 12 переменных.

Базовая диаграмма рассеяния

Мы можем создать диаграмму рассеяния для переменных веса и длины с помощью команды рассеяния.Первая введенная вами переменная будет располагаться по оси Y, а вторая переменная — по оси X:

длина рассеиваемого груза
Диаграмма рассеяния в Стате

Мы видим, что существует сильная положительная корреляция между весом и длиной. То есть автомобили, которые весят больше, как правило, и длиннее.

Диаграмма рассеяния с линией регрессии

Вы можете добавить к диаграмме рассеяния простую линию линейной регрессии, используя два символа «труба» || вместе с командой lfit :

длина рассеиваемого груза || длина веса
Диаграмма рассеяния в Stata с линией регрессии

Диаграмма рассеяния с несколькими переменными

Вы можете создать диаграмму рассеяния с более чем двумя переменными, просто введя дополнительные переменные после команды рассеяния.Обратите внимание, что последняя введенная вами переменная будет использоваться для оси x.

Например, следующая команда указывает Stata создать диаграмму рассеивания, используя длину в качестве переменной по оси X, а вес и смещение в качестве переменных по оси Y:

длина перемещения рассеиваемого груза
Диаграмма рассеяния с несколькими переменными в Stata

Как изменить диаграммы рассеяния в Stata

Мы можем использовать несколько разных команд для изменения внешнего вида диаграмм рассеяния.

Добавление заголовка

Мы можем добавить заголовок к графику с помощью команды title() :

длина разброса веса, заголовок («Вес против длины»)
Точечная диаграмма с заголовком в Stata

Добавление субтитров

Мы также можем добавить подзаголовок под заголовком с помощью команды subtitle() :

разброс веса длина, заголовок («Вес против длины») подзаголовок («n = 74 автомобиля»)
Диаграмма рассеяния в Stata с заголовком и подзаголовком

Добавление комментария

Мы также можем добавить примечание или комментарий внизу графика с помощью команды note() :

длина рассеиваемого груза, примечание («Источник: автомобильные данные 1978 г.»)
Диаграмма рассеяния в Stata с примечанием внизу

Изменение цвета

Мы можем изменить цвет точек на диаграмме рассеяния с помощью команды mcolor() :

Длина рассеиваемого груза, мцвет (зеленый)
Диаграмма рассеяния с разными цветами в Stata

Полный список доступных цветов можно найти в документации Stata по цветам .

Изменение форм

Мы также можем изменить форму точек на диаграмме рассеяния с помощью команды msymbol().Например, символ «D» соответствует ромбам:

длина рассеиваемого груза, мсимв(D)
Диаграмма рассеяния в Stata с различными формами

Полный список доступных форм можно найти в Stata Documentation for shape .

Дополнительные ресурсы

Введение в диаграммы рассеяния
Генератор диаграмм рассеяния

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.