Диаграмма рассеяния — это тип графика, который мы можем использовать для отображения взаимосвязи между двумя переменными. Это помогает нам визуализировать как направление (положительное или отрицательное), так и силу (слабая, умеренная, сильная) взаимосвязи между двумя переменными.
В этом руководстве объясняется, как создавать и изменять диаграммы рассеяния в Stata.
Как создать диаграммы рассеяния в Stata
Мы будем использовать набор данных с именем auto , чтобы проиллюстрировать, как создавать и изменять диаграммы рассеяния в Stata.
Сначала загрузите данные, введя следующее в поле «Команда»:
используйте http://www.stata-press.com/data/r13/auto
Мы можем быстро просмотреть набор данных, введя следующее в поле «Команда»:
подвести итог
![Обобщить пример команды в Stata](https://www.codecamp.ru/content/images/2020/03/scatterStata1.png)
Мы видим, что всего в наборе данных 12 переменных.
Базовая диаграмма рассеяния
Мы можем создать диаграмму рассеяния для переменных веса и длины с помощью команды рассеяния.Первая введенная вами переменная будет располагаться по оси Y, а вторая переменная — по оси X:
длина рассеиваемого груза
![Диаграмма рассеяния в Стате](https://www.codecamp.ru/content/images/2020/03/scatterStata2.png)
Мы видим, что существует сильная положительная корреляция между весом и длиной. То есть автомобили, которые весят больше, как правило, и длиннее.
Диаграмма рассеяния с линией регрессии
Вы можете добавить к диаграмме рассеяния простую линию линейной регрессии, используя два символа «труба» || вместе с командой lfit :
длина рассеиваемого груза || длина веса
![Диаграмма рассеяния в Stata с линией регрессии](https://www.codecamp.ru/content/images/2020/03/scatterStata3.png)
Диаграмма рассеяния с несколькими переменными
Вы можете создать диаграмму рассеяния с более чем двумя переменными, просто введя дополнительные переменные после команды рассеяния.Обратите внимание, что последняя введенная вами переменная будет использоваться для оси x.
Например, следующая команда указывает Stata создать диаграмму рассеивания, используя длину в качестве переменной по оси X, а вес и смещение в качестве переменных по оси Y:
длина перемещения рассеиваемого груза
![Диаграмма рассеяния с несколькими переменными в Stata](https://www.codecamp.ru/content/images/2020/03/scatterStata4.png)
Как изменить диаграммы рассеяния в Stata
Мы можем использовать несколько разных команд для изменения внешнего вида диаграмм рассеяния.
Добавление заголовка
Мы можем добавить заголовок к графику с помощью команды title() :
длина разброса веса, заголовок («Вес против длины»)
![Точечная диаграмма с заголовком в Stata](https://www.codecamp.ru/content/images/2020/03/scatterStata5.png)
Добавление субтитров
Мы также можем добавить подзаголовок под заголовком с помощью команды subtitle() :
разброс веса длина, заголовок («Вес против длины») подзаголовок («n = 74 автомобиля»)
![Диаграмма рассеяния в Stata с заголовком и подзаголовком](https://www.codecamp.ru/content/images/2020/03/scatterStata6.png)
Добавление комментария
Мы также можем добавить примечание или комментарий внизу графика с помощью команды note() :
длина рассеиваемого груза, примечание («Источник: автомобильные данные 1978 г.»)
![Диаграмма рассеяния в Stata с примечанием внизу](https://www.codecamp.ru/content/images/2020/03/scatterStata7.png)
Изменение цвета
Мы можем изменить цвет точек на диаграмме рассеяния с помощью команды mcolor() :
Длина рассеиваемого груза, мцвет (зеленый)
![Диаграмма рассеяния с разными цветами в Stata](https://www.codecamp.ru/content/images/2020/03/scatterStata8.png)
Полный список доступных цветов можно найти в документации Stata по цветам .
Изменение форм
Мы также можем изменить форму точек на диаграмме рассеяния с помощью команды msymbol().Например, символ «D» соответствует ромбам:
длина рассеиваемого груза, мсимв(D)
![Диаграмма рассеяния в Stata с различными формами](https://www.codecamp.ru/content/images/2020/03/scatterStata9.png)
Полный список доступных форм можно найти в Stata Documentation for shape .