Как создавать и изменять гистограммы в Stata


Гистограмма — это тип диаграммы, в которой для представления частот используются прямоугольные столбцы. Это полезный способ визуализации распределения значений данных.

В этом руководстве объясняется, как создавать и изменять гистограммы в Stata.

Как создавать гистограммы в Stata

Мы будем использовать набор данных с именем auto , чтобы проиллюстрировать, как создавать и изменять гистограммы в Stata.

Сначала загрузите данные, введя следующее в поле «Команда»:

используйте http://www.stata-press.com/data/r13/auto

Мы можем быстро просмотреть набор данных, введя следующее в поле «Команда»:

подвести итог

Мы видим, что всего в наборе данных 12 переменных.

Базовая гистограмма

Мы можем создать гистограмму для переменной длины с помощью команды hist :

его длина

Гистограмма с частотами

По умолчанию Stata отображает плотность по оси Y. Вы можете изменить ось Y для отображения фактических частот с помощью команды freq :

Длина гистограммы, частота

Гистограмма с процентами

Вы также можете изменить ось Y, чтобы отображать проценты вместо частот, используя команду процентов :

Длина истории, проценты

Изменение количества ячеек

Когда вы используете функцию hist в Stata, она автоматически сообщает вам, сколько «бинов» она использовала. Например, в предыдущих примерах всегда использовалось 8 бинов:

Однако мы можем указать точное количество бинов с помощью команды bin().Например, следующий код указывает Stata использовать 16 бинов вместо 8:

Длина истории, процентная шкала (16)

Мы также можем указать Stata использовать меньше бинов:

Длина истории, процентная шкала (4)

Обратите внимание, что чем больше бинов вы используете, тем больше детализации вы можете увидеть в данных.

Добавление нормальной плотности к гистограмме

Вы можете добавить кривую нормальной плотности к гистограмме с помощью команды normal :

длина гистограммы, нормальная

Как изменить гистограммы в Stata

Мы можем использовать несколько разных команд для изменения внешнего вида гистограмм.

Добавление заголовка

Мы можем добавить заголовок к графику с помощью команды title() :

длина истории, заголовок («Распределение длины»)

Добавление субтитров

Мы также можем добавить подзаголовок под заголовком с помощью команды subtitle() :

длина, заголовок("Распределение длины") подзаголовок("n = 74 вагона")

Добавление комментария

Мы также можем добавить примечание или комментарий внизу графика с помощью команды note() :

Длина истории, примечание («Источник: автомобильные данные 1978 г.»)