5 примеров двумерных данных в реальной жизни

Двумерные данные относятся к набору данных, который содержит ровно две переменные.

Этот тип данных постоянно встречается в реальных ситуациях, и мы обычно используем следующие методы для анализа этого типа данных:

Диаграммы рассеяния
Коэффициенты корреляции
Простая линейная регрессия

В следующих примерах показаны различные сценарии, в которых двумерные данные появляются в реальной жизни.

Пример 1: Бизнес

Компании часто собирают двумерные данные об общих деньгах, потраченных на рекламу, и общем доходе.

Например, компания может собирать следующие данные за 12 последовательных кварталов продаж:

Это пример двумерных данных, поскольку он содержит информацию ровно о двух переменных: расходах на рекламу и общем доходе.

Бизнес может решить подогнать простую модель линейной регрессии к этому набору данных и найти следующую подогнанную модель:

Общий доход = 14 942,75 + 2,70 * (расходы на рекламу)

Это говорит бизнесу, что на каждый дополнительный доллар, потраченный на рекламу, общий доход увеличивается в среднем на 2,70 доллара.

Пример 2: Медицина

Медицинские исследователи часто собирают двумерные данные, чтобы лучше понять взаимосвязь между переменными, связанными со здоровьем.

Например, исследователь может собрать следующие данные о возрасте и частоте сердечных сокращений в покое для 15 человек:

Затем исследователь может решить рассчитать корреляцию между двумя переменными и найти ее равной 0,812 .

Это указывает на то, что существует сильная положительная корреляция между двумя переменными. То есть по мере увеличения возраста частота сердечных сокращений в покое также имеет тенденцию увеличиваться предсказуемым образом.

По теме: Что считается «сильной» корреляцией?

Пример 3: академики

Исследователи часто собирают двумерные данные, чтобы понять, какие переменные влияют на успеваемость студентов университетов.

Например, исследователь может собирать данные о количестве учебных часов в неделю и соответствующем среднем балле для учащихся определенного класса:

Затем она может создать простую диаграмму рассеяния, чтобы визуализировать взаимосвязь между этими двумя переменными:

Ясно, что существует положительная связь между двумя переменными: по мере увеличения количества часов, изучаемых в неделю, средний балл учащегося также имеет тенденцию к увеличению.

Пример 4: экономика

Экономисты часто собирают двумерные данные, чтобы понять взаимосвязь между двумя социально-экономическими переменными.

Например, экономист может собирать данные об общем количестве лет обучения и общем годовом доходе людей в определенном городе:

Затем он может решить использовать следующую простую модель линейной регрессии:

Годовой доход = -45 353 + 7 120 * (количество лет обучения)

Это говорит экономисту, что за каждый дополнительный год обучения годовой доход увеличивается в среднем на 7120 долларов.

Пример 5: Биология

Биологи часто собирают двумерные данные, чтобы понять, как две переменные связаны между растениями или животными.

Например, биолог может собирать данные об общем количестве осадков и общем количестве растений в разных регионах:

Затем биолог может решить вычислить корреляцию между двумя переменными и найти ее равной 0,926 .

Это указывает на то, что существует сильная положительная корреляция между двумя переменными.

То есть большее количество осадков тесно связано с увеличением количества растений в регионе.

Дополнительные ресурсы

В следующих руководствах представлена дополнительная информация о двумерных данных и о том, как их анализировать.

Введение в двумерный анализ
Введение в одномерный анализ
Введение в коэффициент корреляции Пирсона
Введение в простую линейную регрессию