Гистограмма — это тип диаграммы, в которой для представления частот используются прямоугольные столбцы. Это полезный способ визуализации распределения значений данных.
В этом руководстве объясняется, как создавать и изменять гистограммы в Stata.
Как создавать гистограммы в Stata
Мы будем использовать набор данных с именем auto , чтобы проиллюстрировать, как создавать и изменять гистограммы в Stata.
Сначала загрузите данные, введя следующее в поле «Команда»:
используйте http://www.stata-press.com/data/r13/auto
Мы можем быстро просмотреть набор данных, введя следующее в поле «Команда»:
подвести итог
![Обобщить пример команды в Stata](https://www.codecamp.ru/content/images/2020/03/scatterStata1.png)
Мы видим, что всего в наборе данных 12 переменных.
Базовая гистограмма
Мы можем создать гистограмму для переменной длины с помощью команды hist :
его длина
![Базовая гистограмма в Stata](https://www.codecamp.ru/content/images/2020/03/histStata1.png)
Гистограмма с частотами
По умолчанию Stata отображает плотность по оси Y. Вы можете изменить ось Y для отображения фактических частот с помощью команды freq :
Длина гистограммы, частота
![Гистограмма в Стате](https://www.codecamp.ru/content/images/2020/03/histStata2.png)
Гистограмма с процентами
Вы также можете изменить ось Y, чтобы отображать проценты вместо частот, используя команду процентов :
Длина истории, проценты
![Гистограмма с процентами по оси Y в Stata](https://www.codecamp.ru/content/images/2020/03/histStata3.png)
Изменение количества ячеек
Когда вы используете функцию hist в Stata, она автоматически сообщает вам, сколько «бинов» она использовала. Например, в предыдущих примерах всегда использовалось 8 бинов:
![Гистограмма с бинами в Stata](https://www.codecamp.ru/content/images/2020/03/histStata4.png)
Однако мы можем указать точное количество бинов с помощью команды bin().Например, следующий код указывает Stata использовать 16 бинов вместо 8:
Длина истории, процентная шкала (16)
![Гистограмма в Stata с 16 бинами](https://www.codecamp.ru/content/images/2020/03/histStata5.png)
Мы также можем указать Stata использовать меньше бинов:
Длина истории, процентная шкала (4)
![Статическая гистограмма с 4 бинами](https://www.codecamp.ru/content/images/2020/03/histStata6.png)
Обратите внимание, что чем больше бинов вы используете, тем больше детализации вы можете увидеть в данных.
Добавление нормальной плотности к гистограмме
Вы можете добавить кривую нормальной плотности к гистограмме с помощью команды normal :
длина гистограммы, нормальная
![Гистограмма с кривой нормальной плотности в Stata](https://www.codecamp.ru/content/images/2020/03/histStata10.png)
Как изменить гистограммы в Stata
Мы можем использовать несколько разных команд для изменения внешнего вида гистограмм.
Добавление заголовка
Мы можем добавить заголовок к графику с помощью команды title() :
длина истории, заголовок («Распределение длины»)
![Гистограмма с заголовком в Stata](https://www.codecamp.ru/content/images/2020/03/histStata7.png)
Добавление субтитров
Мы также можем добавить подзаголовок под заголовком с помощью команды subtitle() :
длина, заголовок("Распределение длины") подзаголовок("n = 74 вагона")
![Гистограмма с субтитрами в Stata](https://www.codecamp.ru/content/images/2020/03/histStata8.png)
Добавление комментария
Мы также можем добавить примечание или комментарий внизу графика с помощью команды note() :
Длина истории, примечание («Источник: автомобильные данные 1978 г.»)
![Гистограмма с примечанием в Stata](https://www.codecamp.ru/content/images/2020/03/histStata9.png)