Что такое однофакторный анализ? (Определение и пример)


Термин одномерный анализ относится к анализу одной переменной. Вы можете запомнить это, потому что приставка «уни» означает «один».

Цель одномерного анализа состоит в том, чтобы понять распределение значений одной переменной. Вы можете противопоставить этому типу анализа следующее:

  • Двумерный анализ : анализ двух переменных.
  • Многофакторный анализ: анализ двух или более переменных.

Например, предположим, что у нас есть следующий набор данных:

Мы могли бы выполнить одномерный анализ любой из отдельных переменных в наборе данных, чтобы лучше понять распределение значений.

Например, мы можем выбрать однофакторный анализ переменной Размер домохозяйства :

Существует три распространенных способа выполнения одномерного анализа:

1. Сводная статистика

Наиболее распространенным способом выполнения одномерного анализа является описание переменной с помощью сводной статистики .

Существует два популярных типа сводной статистики:

  • Меры центральной тенденции : эти числа описывают, где расположен центр набора данных. Примеры включают среднее значение и медиану .
  • Меры дисперсии : эти числа описывают, насколько разбросаны значения в наборе данных. Примеры включают размах , межквартильный размах , стандартное отклонение и дисперсию .

2. Частотные распределения

Другой способ выполнения одномерного анализа — создатьчастотное распределение , которое описывает, как часто разные значения встречаются в наборе данных.

3. Графики

Еще один способ выполнения одномерного анализа — создание диаграмм для визуализации распределения значений определенной переменной.

Общие примеры включают:

  • Блочные диаграммы
  • Гистограммы
  • Кривые плотности
  • Круговые диаграммы

В следующих примерах показано, как выполнять каждый тип одномерного анализа с использованием переменной « Размер домохозяйства » из нашего набора данных, упомянутого ранее:

Сводные статистические данные

Мы можем рассчитать следующие показатели центральной тенденции размера домохозяйства:

  • Среднее значение (среднее значение): 3,8
  • Медиана (среднее значение): 4

Эти значения дают нам представление о том, где находится «центральное» значение.

Мы также можем рассчитать следующие меры дисперсии:

  • Диапазон (разница между максимальным и минимальным): 6
  • Межквартильный размах (разброс средних 50% значений): 2,5
  • Стандартное отклонение (средняя мера разброса): 1,87

Эти значения дают нам представление о том, насколько разбросаны значения для этой переменной.

Частотные распределения

Мы также можем создать следующую таблицу частотного распределения, чтобы обобщить, как часто встречаются разные значения:

Это позволяет нам быстро увидеть, что наиболее часто встречающийся размер домохозяйства равен 4 .

Ресурс: Вы можете использовать этот Калькулятор частоты , чтобы автоматически произвести распределение частоты для любой переменной.

Графики

Мы можем создать следующие диаграммы, которые помогут нам визуализировать распределение значений размера домохозяйства:

1. Блочная диаграмма

Блочная диаграмма — это график, показывающий сводку набора данных из пяти чисел.

Резюме из пяти цифр включает в себя:

  • Минимальное значение
  • Первый квартиль
  • Среднее значение
  • Третий квартиль
  • Максимальное значение

Вот как будет выглядеть ящичковая диаграмма для переменной «Размер домохозяйства»:

Ресурс: вы можете использовать этот генератор блочных диаграмм для автоматического создания блочной диаграммы для любой переменной.

2. Гистограмма

Гистограмма — это тип диаграммы, в которой для отображения частот используются вертикальные полосы. Этот тип диаграммы является удобным способом визуализации распределения значений в наборе данных.

Вот как будет выглядеть гистограмма для переменной Размер домохозяйства:

3. Кривая плотности

Кривая плотности — это кривая на графике, представляющая распределение значений в наборе данных.

Это особенно полезно для визуализации «формы» распределения, в том числе, имеет ли распределение один или несколько «пиков» часто встречающихся значений и имеет ли распределение наклон влево или вправо .

Вот как будет выглядеть кривая плотности для переменной Размер домохозяйства:

4. Круговая диаграмма

Круговая диаграмма — это тип диаграммы, которая имеет форму круга и использует срезы для представления пропорций целого.

Вот как будет выглядеть круговая диаграмма для переменной Размер домохозяйства:

В зависимости от типа данных одна из этих диаграмм может быть более полезной для визуализации распределения значений, чем другие.