Одномерный и многомерный анализ: в чем разница?

Одномерный и многомерный анализ: в чем разница?

Термин одномерный анализ относится к анализу одной переменной. Вы можете запомнить это, потому что приставка «уни» означает «один».

Термин многофакторный анализ относится к анализу более чем одной переменной. Вы можете запомнить это, потому что приставка «мульти» означает «более одного».

Существует три распространенных способа выполнения одномерного анализа :

1. Сводная статистика

2. Частотные распределения

3. Графики

  • Мы можем создавать диаграммы, такие как диаграммы, гистограммы, кривые плотности и т. д., чтобы визуализировать распределение значений для одной переменной.

Существует два распространенных способа выполнения многофакторного анализа :

1. Матрица рассеяния

  • Мы можем создать матрицу диаграммы рассеяния, которая позволяет нам визуализировать взаимосвязь между каждой парной комбинацией переменных в наборе данных.

2. Алгоритмы машинного обучения

  • Мы можем использовать алгоритм обучения с учителем, чтобы соответствовать такой модели, как множественная линейная регрессия , которая количественно определяет взаимосвязь между несколькими переменными-предикторами и переменной ответа.
  • Мы также можем использовать алгоритм обучения без учителя, такой как анализ основных компонентов, чтобы одновременно найти структуру и взаимосвязи между несколькими переменными в наборе данных.

В следующих примерах показано, как выполнять как одномерный, так и многомерный анализ со следующим набором данных:

Примечание.Когда вы анализируете ровно две переменные, это называется двумерным анализом .

Пример. Как выполнить одномерный анализ

Мы могли бы выполнить одномерный анализ любой из отдельных переменных в наборе данных.

Например, мы можем выбрать однофакторный анализ переменной Размер домохозяйства :

Пример одномерного анализа

Мы можем рассчитать следующие показатели центральной тенденции размера домохозяйства:

  • Среднее значение (среднее значение): 3,8
  • Медиана (среднее значение): 4

Эти значения дают нам представление о том, где находится «центральное» значение.

Мы также можем рассчитать следующие меры дисперсии:

  • Диапазон (разница между максимальным и минимальным): 6
  • Межквартильный размах (разброс средних 50% значений): 2,5
  • Стандартное отклонение (средняя мера разброса): 1,87

Эти значения дают нам представление о том, насколько разбросаны значения для этой переменной.

Мы также можем создать следующую таблицу частотного распределения, чтобы обобщить, как часто встречаются разные значения:

Мы также можем создать блочную диаграмму, чтобы визуализировать распределение значений размера домохозяйства:

В качестве альтернативы мы могли бы создать гистограмму для визуализации распределения значений:

Рассчитав эти показатели и создав эти диаграммы, мы можем получить четкое представление о том, как распределяются значения переменной «Размер домохозяйства».

Пример. Как выполнить многомерный анализ

Еще раз предположим, что у нас есть один и тот же набор данных:

Одной из простых форм многомерного анализа, которую мы могли бы выполнить для этого набора данных, является создание матрицы диаграммы рассеяния , которая представляет собой матрицу, показывающую диаграмму рассеяния для каждой попарной комбинации числовых переменных в наборе данных.

Мы могли бы создать матрицу такого типа, чтобы одновременно визуализировать взаимосвязь между размером домохозяйства, годовым доходом и количеством домашних животных.

Ресурс : ознакомьтесь с этим руководством , чтобы узнать, как создать матрицу диаграммы рассеяния в R.

Другим способом выполнения многомерного анализа этого набора данных может быть применение модели множественной линейной регрессии.Например, мы могли бы создать регрессионную модель, которая использует размер домохозяйства и количество домашних животных для прогнозирования годового дохода.

Ресурс : ознакомьтесь с этим руководством , чтобы узнать, как выполнить множественную линейную регрессию в R.

Еще одним способом выполнения многомерного анализа этого набора данных может быть выполнение анализа основных компонентов , который позволяет нам найти базовую структуру в наборе данных.

Ресурс : ознакомьтесь с этим руководством , чтобы узнать, как выполнить анализ основных компонентов в R.

Вывод

Вот краткий обзор этой статьи:

  • Одномерный анализ – это анализ одной переменной.
  • Многофакторный анализ — это анализ более чем одной переменной.
  • Существуют различные способы выполнения каждого типа анализа в зависимости от вашей конечной цели.
  • В реальном мире мы часто выполняем оба типа анализа на одном наборе данных.
  • Одномерный анализ позволяет нам понять распределение значений одной переменной, тогда как многомерный анализ позволяет понять взаимосвязь между несколькими переменными.
Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.