Как создавать и интерпретировать диаграммы в SPSS


Блочная диаграмма используется для визуализации сводки набора данных из пяти чисел, которая включает в себя:

  • Минимум
  • Первый квартиль
  • медиана
  • Третий квартиль
  • Максимум

В этом руководстве объясняется, как создавать и изменять ящичные диаграммы в SPSS.

Как создать одиночную диаграмму в SPSS

Предположим, у нас есть следующий набор данных, который показывает среднее количество очков, набранных за игру 16 баскетболистами в определенной команде:

Чтобы создать блочную диаграмму для визуализации распределения этих значений данных, мы можем щелкнуть вкладку « Анализ », затем « Описательная статистика », затем « Исследовать »:

Это вызовет следующее окно:

Чтобы создать ящичковую диаграмму, перетащите переменные точки в поле с надписью Зависимый список.Затем убедитесь, что Plots выбраны в опции, которая говорит Display в нижней части окна.

После того, как вы нажмете OK , появится следующий блок-график:

Вот как интерпретировать этот блок-график:

Примечание о выбросах

Межквартильный размах (IQR) — это расстояние между третьим квартилем и первым квартилем. SPSS считает любое значение данных выбросом, если оно в 1,5 раза превышает IQR третьего квартиля или в 1,5 раза превышает IQR меньше первого квартиля.

Выбросы отображаются в виде крошечных кружочков в SPSS. В предыдущем примере не было выбросов, поэтому на блочной диаграмме не было показано крошечных кружочков. Однако, если наше самое большое значение в наборе данных на самом деле равно 50, то на блочной диаграмме будет показан крошечный кружок, указывающий на выброс:

Если в вашем наборе данных присутствует выброс, у вас есть несколько вариантов:

  • Убедитесь, что выброс не является ошибкой ввода данных. Иногда значения данных просто записываются неправильно. Если присутствует выброс, сначала убедитесь, что значение было введено правильно и что это не ошибка.
  • Присвойте новое значение выбросу.Если выброс оказался результатом ошибки ввода данных, вы можете решить присвоить ему новое значение, такое как среднее значение или медиана набора данных.
  • Удалите выброс. Если значение является истинным выбросом, вы можете удалить его, если оно окажет значительное влияние на общий анализ. Просто не забудьте упомянуть в своем окончательном отчете или анализе, что вы удалили выброс.

Как создать несколько блочных диаграмм в SPSS

Если у вас есть несколько переменных, SPSS также может создать несколько параллельных блочных диаграмм. Например, предположим, что у нас есть следующие данные о среднем количестве очков, набранных 16 игроками в трех разных командах:

Чтобы создать ящичковую диаграмму для каждой из этих переменных, мы можем еще раз щелкнуть вкладку « Анализ », затем « Описательная статистика », затем « Исследовать ». Затем мы можем перетащить все три переменные в поле с надписью Dependent List :

Как только мы нажмем OK , появятся следующие диаграммы:

Это помогает нам легко визуализировать различия в распределениях между этими тремя командами.

Мы также можем наблюдать следующее:

  • Среднее количество очков, набранных за игру, является самым высоким для команды B и самым низким для команды C.
  • Различие в количестве очков, набранных за игру, является самым высоким для команды B, что можно увидеть по тому, как долго их блок-схема сравнивается с командой A и командой C.
  • Игрок с наибольшим количеством очков за игру входит в команду B, а игрок с наименьшим количеством очков за игру - в команду C.

Блочные диаграммы полезны, потому что они могут предоставить нам так много информации о распределении наборов данных только из одного графика.