Краткое введение в двумерный анализ

Краткое введение в двумерный анализ

Термин двумерный анализ относится к анализу двух переменных. Вы можете запомнить это, потому что приставка «би» означает «два».

Цель двумерного анализа - понять взаимосвязь между двумя переменными. Вы можете противопоставить этому типу анализа следующее:

  • Одномерный анализ : анализ одной переменной.
  • Многофакторный анализ: анализ двух или более переменных.

Существует три распространенных способа выполнения двумерного анализа:

1. Диаграммы рассеяния.

2. Коэффициенты корреляции.

3. Простая линейная регрессия.

В этом руководстве представлен пример каждого из этих типов двумерного анализа с использованием следующего набора данных, который содержит информацию о двух переменных: (1) количество часов, потраченных на учебу, и (2) оценка за экзамен, полученная 20 разными учащимися:

1. Диаграммы рассеяния

Диаграмма рассеяния предлагает визуальный способ выполнения двумерного анализа. Это позволяет нам визуализировать взаимосвязь между двумя переменными, помещая значение одной переменной на ось x и значение другой переменной на ось y.

На приведенной ниже диаграмме рассеяния мы размещаем часы обучения по оси x и баллы за экзамен по оси y:

Двумерный анализ с диаграммой рассеяния

Мы можем ясно видеть, что между двумя переменными существует положительная связь: по мере увеличения количества часов обучения экзаменационные баллы также имеют тенденцию к увеличению.

2. Коэффициенты корреляции

Коэффициент корреляции предлагает еще один способ выполнения двумерного анализа. Наиболее распространенным типом коэффициента корреляции является коэффициент корреляции Пирсона , который является мерой линейной связи между двумя переменными.Он имеет значение от -1 до 1, где:

  • -1 указывает на совершенно отрицательную линейную корреляцию между двумя переменными
  • 0 указывает на отсутствие линейной корреляции между двумя переменными
  • 1 указывает на совершенно положительную линейную корреляцию между двумя переменными.

Этот простой показатель дает нам хорошее представление о том, как связаны две переменные. На практике мы часто используем диаграммы рассеяния и коэффициенты корреляции, чтобы понять взаимосвязь между двумя переменными, чтобы мы могли визуализировать и количественно оценить их взаимосвязь.

3. Простая линейная регрессия

Третий способ выполнения двумерного анализа — простая линейная регрессия .

Используя этот метод, мы выбираем одну переменную в качестве объясняющей переменной , а другую переменную в качестве переменной отклика.Затем мы находим линию, которая лучше всего «соответствует» набору данных, которую мы затем можем использовать, чтобы понять точную связь между двумя переменными.

Например, линия наилучшего соответствия для набора данных выше:

Экзаменационный балл = 69,07 + 3,85*(учебные часы)

Это означает, что каждый дополнительный час обучения связан с увеличением среднего экзаменационного балла на 3,85. Подбирая эту модель линейной регрессии, мы можем количественно определить точную взаимосвязь между часами обучения и полученными баллами за экзамен.

Связанный: Как выполнить простую линейную регрессию в Excel

Вывод

Двумерный анализ — один из наиболее распространенных типов анализа, используемых в статистике, потому что нас часто интересует понимание взаимосвязи между двумя переменными.

Используя диаграммы рассеяния, коэффициенты корреляции и простую линейную регрессию, мы можем визуализировать и количественно оценить взаимосвязь между двумя переменными.

Часто все эти три метода используются в анализе вместе, чтобы получить полное представление о том, как связаны две переменные, поэтому рекомендуется ознакомиться с каждым методом.

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.