Как создавать и изменять диаграммы рассеяния в Stata


Диаграмма рассеяния — это тип графика, который мы можем использовать для отображения взаимосвязи между двумя переменными. Это помогает нам визуализировать как направление (положительное или отрицательное), так и силу (слабая, умеренная, сильная) взаимосвязи между двумя переменными.

В этом руководстве объясняется, как создавать и изменять диаграммы рассеяния в Stata.

Как создать диаграммы рассеяния в Stata

Мы будем использовать набор данных с именем auto , чтобы проиллюстрировать, как создавать и изменять диаграммы рассеяния в Stata.

Сначала загрузите данные, введя следующее в поле «Команда»:

используйте http://www.stata-press.com/data/r13/auto

Мы можем быстро просмотреть набор данных, введя следующее в поле «Команда»:

подвести итог

Мы видим, что всего в наборе данных 12 переменных.

Базовая диаграмма рассеяния

Мы можем создать диаграмму рассеяния для переменных веса и длины с помощью команды рассеяния.Первая введенная вами переменная будет располагаться по оси Y, а вторая переменная — по оси X:

длина рассеиваемого груза

Мы видим, что существует сильная положительная корреляция между весом и длиной. То есть автомобили, которые весят больше, как правило, и длиннее.

Диаграмма рассеяния с линией регрессии

Вы можете добавить к диаграмме рассеяния простую линию линейной регрессии, используя два символа «труба» || вместе с командой lfit :

длина рассеиваемого груза || длина веса

Диаграмма рассеяния с несколькими переменными

Вы можете создать диаграмму рассеяния с более чем двумя переменными, просто введя дополнительные переменные после команды рассеяния.Обратите внимание, что последняя введенная вами переменная будет использоваться для оси x.

Например, следующая команда указывает Stata создать диаграмму рассеивания, используя длину в качестве переменной по оси X, а вес и смещение в качестве переменных по оси Y:

длина перемещения рассеиваемого груза

Как изменить диаграммы рассеяния в Stata

Мы можем использовать несколько разных команд для изменения внешнего вида диаграмм рассеяния.

Добавление заголовка

Мы можем добавить заголовок к графику с помощью команды title() :

длина разброса веса, заголовок («Вес против длины»)

Добавление субтитров

Мы также можем добавить подзаголовок под заголовком с помощью команды subtitle() :

разброс веса длина, заголовок («Вес против длины») подзаголовок («n = 74 автомобиля»)

Добавление комментария

Мы также можем добавить примечание или комментарий внизу графика с помощью команды note() :

длина рассеиваемого груза, примечание («Источник: автомобильные данные 1978 г.»)

Изменение цвета

Мы можем изменить цвет точек на диаграмме рассеяния с помощью команды mcolor() :

Длина рассеиваемого груза, мцвет (зеленый)

Полный список доступных цветов можно найти в документации Stata по цветам .

Изменение форм

Мы также можем изменить форму точек на диаграмме рассеяния с помощью команды msymbol().Например, символ «D» соответствует ромбам:

длина рассеиваемого груза, мсимв(D)

Полный список доступных форм можно найти в Stata Documentation for shape .

Дополнительные ресурсы

Введение в диаграммы рассеяния
Генератор диаграмм рассеяния