Термин одномерный анализ относится к анализу одной переменной. Вы можете запомнить это, потому что приставка «уни» означает «один».
Термин многофакторный анализ относится к анализу более чем одной переменной. Вы можете запомнить это, потому что приставка «мульти» означает «более одного».
Существует три распространенных способа выполнения одномерного анализа :
1. Сводная статистика
- Мы можем рассчитать меры центральной тенденции , такие как среднее значение или медиана для одной переменной.
- Мы также можем рассчитать меры дисперсии , такие как стандартное отклонение для одной переменной.
2. Частотные распределения
- Мы можем создатьчастотное распределение , которое описывает, как часто каждое значение встречается для одной переменной.
3. Графики
- Мы можем создавать диаграммы, такие как диаграммы, гистограммы, кривые плотности и т. д., чтобы визуализировать распределение значений для одной переменной.
Существует два распространенных способа выполнения многофакторного анализа :
1. Матрица рассеяния
- Мы можем создать матрицу диаграммы рассеяния, которая позволяет нам визуализировать взаимосвязь между каждой парной комбинацией переменных в наборе данных.
2. Алгоритмы машинного обучения
- Мы можем использовать алгоритм обучения с учителем, чтобы соответствовать такой модели, как множественная линейная регрессия , которая количественно определяет взаимосвязь между несколькими переменными-предикторами и переменной ответа.
- Мы также можем использовать алгоритм обучения без учителя, такой как анализ основных компонентов, чтобы одновременно найти структуру и взаимосвязи между несколькими переменными в наборе данных.
В следующих примерах показано, как выполнять как одномерный, так и многомерный анализ со следующим набором данных:

Примечание.Когда вы анализируете ровно две переменные, это называется двумерным анализом .
Пример. Как выполнить одномерный анализ
Мы могли бы выполнить одномерный анализ любой из отдельных переменных в наборе данных.
Например, мы можем выбрать однофакторный анализ переменной Размер домохозяйства :

Мы можем рассчитать следующие показатели центральной тенденции размера домохозяйства:
- Среднее значение (среднее значение): 3,8
- Медиана (среднее значение): 4
Эти значения дают нам представление о том, где находится «центральное» значение.
Мы также можем рассчитать следующие меры дисперсии:
- Диапазон (разница между максимальным и минимальным): 6
- Межквартильный размах (разброс средних 50% значений): 2,5
- Стандартное отклонение (средняя мера разброса): 1,87
Эти значения дают нам представление о том, насколько разбросаны значения для этой переменной.
Мы также можем создать следующую таблицу частотного распределения, чтобы обобщить, как часто встречаются разные значения:

Мы также можем создать блочную диаграмму, чтобы визуализировать распределение значений размера домохозяйства:

В качестве альтернативы мы могли бы создать гистограмму для визуализации распределения значений:

Рассчитав эти показатели и создав эти диаграммы, мы можем получить четкое представление о том, как распределяются значения переменной «Размер домохозяйства».
Пример. Как выполнить многомерный анализ
Еще раз предположим, что у нас есть один и тот же набор данных:

Одной из простых форм многомерного анализа, которую мы могли бы выполнить для этого набора данных, является создание матрицы диаграммы рассеяния , которая представляет собой матрицу, показывающую диаграмму рассеяния для каждой попарной комбинации числовых переменных в наборе данных.
Мы могли бы создать матрицу такого типа, чтобы одновременно визуализировать взаимосвязь между размером домохозяйства, годовым доходом и количеством домашних животных.
Ресурс : ознакомьтесь с этим руководством , чтобы узнать, как создать матрицу диаграммы рассеяния в R.
Другим способом выполнения многомерного анализа этого набора данных может быть применение модели множественной линейной регрессии.Например, мы могли бы создать регрессионную модель, которая использует размер домохозяйства и количество домашних животных для прогнозирования годового дохода.
Ресурс : ознакомьтесь с этим руководством , чтобы узнать, как выполнить множественную линейную регрессию в R.
Еще одним способом выполнения многомерного анализа этого набора данных может быть выполнение анализа основных компонентов , который позволяет нам найти базовую структуру в наборе данных.
Ресурс : ознакомьтесь с этим руководством , чтобы узнать, как выполнить анализ основных компонентов в R.
Вывод
Вот краткий обзор этой статьи:
- Одномерный анализ – это анализ одной переменной.
- Многофакторный анализ — это анализ более чем одной переменной.
- Существуют различные способы выполнения каждого типа анализа в зависимости от вашей конечной цели.
- В реальном мире мы часто выполняем оба типа анализа на одном наборе данных.
- Одномерный анализ позволяет нам понять распределение значений одной переменной, тогда как многомерный анализ позволяет понять взаимосвязь между несколькими переменными.