Термин одномерный анализ относится к анализу одной переменной. Вы можете запомнить это, потому что приставка «уни» означает «один».
Цель одномерного анализа состоит в том, чтобы понять распределение значений одной переменной. Вы можете противопоставить этому типу анализа следующее:
- Двумерный анализ : анализ двух переменных.
- Многофакторный анализ: анализ двух или более переменных.
Например, предположим, что у нас есть следующий набор данных:

Мы могли бы выполнить одномерный анализ любой из отдельных переменных в наборе данных, чтобы лучше понять распределение значений.
Например, мы можем выбрать однофакторный анализ переменной Размер домохозяйства :

Существует три распространенных способа выполнения одномерного анализа:
1. Сводная статистика
Наиболее распространенным способом выполнения одномерного анализа является описание переменной с помощью сводной статистики .
Существует два популярных типа сводной статистики:
- Меры центральной тенденции : эти числа описывают, где расположен центр набора данных. Примеры включают среднее значение и медиану .
- Меры дисперсии : эти числа описывают, насколько разбросаны значения в наборе данных. Примеры включают размах , межквартильный размах , стандартное отклонение и дисперсию .
2. Частотные распределения
Другой способ выполнения одномерного анализа — создатьчастотное распределение , которое описывает, как часто разные значения встречаются в наборе данных.
3. Графики
Еще один способ выполнения одномерного анализа — создание диаграмм для визуализации распределения значений определенной переменной.
Общие примеры включают:
- Блочные диаграммы
- Гистограммы
- Кривые плотности
- Круговые диаграммы
В следующих примерах показано, как выполнять каждый тип одномерного анализа с использованием переменной « Размер домохозяйства » из нашего набора данных, упомянутого ранее:

Сводные статистические данные
Мы можем рассчитать следующие показатели центральной тенденции размера домохозяйства:
- Среднее значение (среднее значение): 3,8
- Медиана (среднее значение): 4
Эти значения дают нам представление о том, где находится «центральное» значение.
Мы также можем рассчитать следующие меры дисперсии:
- Диапазон (разница между максимальным и минимальным): 6
- Межквартильный размах (разброс средних 50% значений): 2,5
- Стандартное отклонение (средняя мера разброса): 1,87
Эти значения дают нам представление о том, насколько разбросаны значения для этой переменной.
Частотные распределения
Мы также можем создать следующую таблицу частотного распределения, чтобы обобщить, как часто встречаются разные значения:

Это позволяет нам быстро увидеть, что наиболее часто встречающийся размер домохозяйства равен 4 .
Ресурс: Вы можете использовать этот Калькулятор частоты , чтобы автоматически произвести распределение частоты для любой переменной.
Графики
Мы можем создать следующие диаграммы, которые помогут нам визуализировать распределение значений размера домохозяйства:
1. Блочная диаграмма
Блочная диаграмма — это график, показывающий сводку набора данных из пяти чисел.
Резюме из пяти цифр включает в себя:
- Минимальное значение
- Первый квартиль
- Среднее значение
- Третий квартиль
- Максимальное значение
Вот как будет выглядеть ящичковая диаграмма для переменной «Размер домохозяйства»:

Ресурс: вы можете использовать этот генератор блочных диаграмм для автоматического создания блочной диаграммы для любой переменной.
2. Гистограмма
Гистограмма — это тип диаграммы, в которой для отображения частот используются вертикальные полосы. Этот тип диаграммы является удобным способом визуализации распределения значений в наборе данных.
Вот как будет выглядеть гистограмма для переменной Размер домохозяйства:

3. Кривая плотности
Кривая плотности — это кривая на графике, представляющая распределение значений в наборе данных.
Это особенно полезно для визуализации «формы» распределения, в том числе, имеет ли распределение один или несколько «пиков» часто встречающихся значений и имеет ли распределение наклон влево или вправо .
Вот как будет выглядеть кривая плотности для переменной Размер домохозяйства:

4. Круговая диаграмма
Круговая диаграмма — это тип диаграммы, которая имеет форму круга и использует срезы для представления пропорций целого.
Вот как будет выглядеть круговая диаграмма для переменной Размер домохозяйства:

В зависимости от типа данных одна из этих диаграмм может быть более полезной для визуализации распределения значений, чем другие.