Двумерные данные относятся к набору данных, который содержит ровно две переменные.
Этот тип данных постоянно встречается в реальных ситуациях, и мы обычно используем следующие методы для анализа этого типа данных:
- Диаграммы рассеяния
- Коэффициенты корреляции
- Простая линейная регрессия
В следующих примерах показаны различные сценарии, в которых двумерные данные появляются в реальной жизни.
Пример 1: Бизнес
Компании часто собирают двумерные данные об общих деньгах, потраченных на рекламу, и общем доходе.
Например, компания может собирать следующие данные за 12 последовательных кварталов продаж:

Это пример двумерных данных, поскольку он содержит информацию ровно о двух переменных: расходах на рекламу и общем доходе.
Бизнес может решить подогнать простую модель линейной регрессии к этому набору данных и найти следующую подогнанную модель:
Общий доход = 14 942,75 + 2,70 * (расходы на рекламу)
Это говорит бизнесу, что на каждый дополнительный доллар, потраченный на рекламу, общий доход увеличивается в среднем на 2,70 доллара.
Пример 2: Медицина
Медицинские исследователи часто собирают двумерные данные, чтобы лучше понять взаимосвязь между переменными, связанными со здоровьем.
Например, исследователь может собрать следующие данные о возрасте и частоте сердечных сокращений в покое для 15 человек:

Затем исследователь может решить рассчитать корреляцию между двумя переменными и найти ее равной 0,812 .
Это указывает на то, что существует сильная положительная корреляция между двумя переменными. То есть по мере увеличения возраста частота сердечных сокращений в покое также имеет тенденцию увеличиваться предсказуемым образом.
По теме: Что считается «сильной» корреляцией?
Пример 3: академики
Исследователи часто собирают двумерные данные, чтобы понять, какие переменные влияют на успеваемость студентов университетов.
Например, исследователь может собирать данные о количестве учебных часов в неделю и соответствующем среднем балле для учащихся определенного класса:

Затем она может создать простую диаграмму рассеяния, чтобы визуализировать взаимосвязь между этими двумя переменными:

Ясно, что существует положительная связь между двумя переменными: по мере увеличения количества часов, изучаемых в неделю, средний балл учащегося также имеет тенденцию к увеличению.
Пример 4: экономика
Экономисты часто собирают двумерные данные, чтобы понять взаимосвязь между двумя социально-экономическими переменными.
Например, экономист может собирать данные об общем количестве лет обучения и общем годовом доходе людей в определенном городе:

Затем он может решить использовать следующую простую модель линейной регрессии:
Годовой доход = -45 353 + 7 120 * (количество лет обучения)
Это говорит экономисту, что за каждый дополнительный год обучения годовой доход увеличивается в среднем на 7120 долларов.
Пример 5: Биология
Биологи часто собирают двумерные данные, чтобы понять, как две переменные связаны между растениями или животными.
Например, биолог может собирать данные об общем количестве осадков и общем количестве растений в разных регионах:

Затем биолог может решить вычислить корреляцию между двумя переменными и найти ее равной 0,926 .
Это указывает на то, что существует сильная положительная корреляция между двумя переменными.
То есть большее количество осадков тесно связано с увеличением количества растений в регионе.
Дополнительные ресурсы
В следующих руководствах представлена дополнительная информация о двумерных данных и о том, как их анализировать.
Введение в двумерный анализ
Введение в одномерный анализ
Введение в коэффициент корреляции Пирсона
Введение в простую линейную регрессию