Что такое однофакторный анализ? (Определение и пример)

Что такое однофакторный анализ? (Определение и пример)

Термин одномерный анализ относится к анализу одной переменной. Вы можете запомнить это, потому что приставка «уни» означает «один».

Цель одномерного анализа состоит в том, чтобы понять распределение значений одной переменной. Вы можете противопоставить этому типу анализа следующее:

  • Двумерный анализ : анализ двух переменных.
  • Многофакторный анализ: анализ двух или более переменных.

Например, предположим, что у нас есть следующий набор данных:

Мы могли бы выполнить одномерный анализ любой из отдельных переменных в наборе данных, чтобы лучше понять распределение значений.

Например, мы можем выбрать однофакторный анализ переменной Размер домохозяйства :

Пример одномерного анализа

Существует три распространенных способа выполнения одномерного анализа:

1. Сводная статистика

Наиболее распространенным способом выполнения одномерного анализа является описание переменной с помощью сводной статистики .

Существует два популярных типа сводной статистики:

  • Меры центральной тенденции : эти числа описывают, где расположен центр набора данных. Примеры включают среднее значение и медиану .
  • Меры дисперсии : эти числа описывают, насколько разбросаны значения в наборе данных. Примеры включают размах , межквартильный размах , стандартное отклонение и дисперсию .

2. Частотные распределения

Другой способ выполнения одномерного анализа — создатьчастотное распределение , которое описывает, как часто разные значения встречаются в наборе данных.

3. Графики

Еще один способ выполнения одномерного анализа — создание диаграмм для визуализации распределения значений определенной переменной.

Общие примеры включают:

  • Блочные диаграммы
  • Гистограммы
  • Кривые плотности
  • Круговые диаграммы

В следующих примерах показано, как выполнять каждый тип одномерного анализа с использованием переменной « Размер домохозяйства » из нашего набора данных, упомянутого ранее:

Пример одномерного анализа

Сводные статистические данные

Мы можем рассчитать следующие показатели центральной тенденции размера домохозяйства:

  • Среднее значение (среднее значение): 3,8
  • Медиана (среднее значение): 4

Эти значения дают нам представление о том, где находится «центральное» значение.

Мы также можем рассчитать следующие меры дисперсии:

  • Диапазон (разница между максимальным и минимальным): 6
  • Межквартильный размах (разброс средних 50% значений): 2,5
  • Стандартное отклонение (средняя мера разброса): 1,87

Эти значения дают нам представление о том, насколько разбросаны значения для этой переменной.

Частотные распределения

Мы также можем создать следующую таблицу частотного распределения, чтобы обобщить, как часто встречаются разные значения:

Это позволяет нам быстро увидеть, что наиболее часто встречающийся размер домохозяйства равен 4 .

Ресурс: Вы можете использовать этот Калькулятор частоты , чтобы автоматически произвести распределение частоты для любой переменной.

Графики

Мы можем создать следующие диаграммы, которые помогут нам визуализировать распределение значений размера домохозяйства:

1. Блочная диаграмма

Блочная диаграмма — это график, показывающий сводку набора данных из пяти чисел.

Резюме из пяти цифр включает в себя:

  • Минимальное значение
  • Первый квартиль
  • Среднее значение
  • Третий квартиль
  • Максимальное значение

Вот как будет выглядеть ящичковая диаграмма для переменной «Размер домохозяйства»:

Ресурс: вы можете использовать этот генератор блочных диаграмм для автоматического создания блочной диаграммы для любой переменной.

2. Гистограмма

Гистограмма — это тип диаграммы, в которой для отображения частот используются вертикальные полосы. Этот тип диаграммы является удобным способом визуализации распределения значений в наборе данных.

Вот как будет выглядеть гистограмма для переменной Размер домохозяйства:

3. Кривая плотности

Кривая плотности — это кривая на графике, представляющая распределение значений в наборе данных.

Это особенно полезно для визуализации «формы» распределения, в том числе, имеет ли распределение один или несколько «пиков» часто встречающихся значений и имеет ли распределение наклон влево или вправо .

Вот как будет выглядеть кривая плотности для переменной Размер домохозяйства:

4. Круговая диаграмма

Круговая диаграмма — это тип диаграммы, которая имеет форму круга и использует срезы для представления пропорций целого.

Вот как будет выглядеть круговая диаграмма для переменной Размер домохозяйства:

В зависимости от типа данных одна из этих диаграмм может быть более полезной для визуализации распределения значений, чем другие.

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.