Как создать таблицу непредвиденных обстоятельств в R


Таблица непредвиденных обстоятельств (иногда называемая «перекрестными таблицами») — это тип таблицы, которая обобщает взаимосвязь между двумя категориальными переменными.

К счастью, в R легко создать таблицу непредвиденных обстоятельств для переменных с помощью функции сводной таблицы. В этом руководстве показан пример того, как это сделать.

Пример: Таблица непредвиденных обстоятельств в R

Предположим, у нас есть следующий набор данных, который показывает информацию о 20 различных заказах продуктов, включая тип приобретенного продукта и страну, в которой продукт был приобретен:

#create data
df <- data.frame(order_num = 1:20,
 product= rep (c('TV', 'Radio', 'Computer'), times =c(9, 6, 5)),
 country= rep (c('A', 'B', 'C', 'D'), times =5))

#view data
df

 order_num product country
1 1 TV A
2 2 TV B
3 3 TV C
4 4 TV D
5 5 TV A
6 6 TV B
7 7 TV C
8 8 TV D
9 9 TV A
10 10 Radio B
11 11 Radio C
12 12 Radio D
13 13 Radio A
14 14 Radio B
15 15 Radio C
16 16 Computer D
17 17 Computer A
18 18 Computer B
19 19 Computer C
20 20 Computer D

Чтобы создать таблицу непредвиденных обстоятельств, мы можем просто использовать функцию table() и указать переменные product и country в качестве аргументов:

#create contingency table
table <- table(df$product, df$country)

#view contingency table
table

 A B C D
 Computer 1 1 1 2
 Radio 1 2 2 1
 TV 3 2 2 2

Мы также можем использовать функцию addmargins() для добавления полей к таблице:

#add margins to contingency table
table_w_margins <- addmargins(table)

#view contingency table
table_w_margins

 A B C D Sum
 Computer 1 1 1 2 5
 Radio 1 2 2 1 6
 TV 3 2 2 2 9
 Sum 5 5 5 5 20

Вот как интерпретировать таблицу:

  • Значение в правом нижнем углу показывает общее количество заказанных товаров: 20.
  • Значения справа показывают суммы строк: всего было заказано 5 компьютеров, 6 радиоприемников и 9 телевизоров.
  • Значения в нижней части таблицы показывают суммы столбцов: Всего было заказано 5 товаров из страны A, 5 из страны B, 5 из страны C и 5 из страны D.
  • Значения внутри таблицы показывают количество конкретных товаров, заказанных в каждой стране: 1 компьютер из страны А, 1 радиоприемник из страны А, 3 телевизора из страны А и т. д.

Дополнительные ресурсы

Как усреднить по столбцам в R
Как суммировать определенные столбцы в R
Как вычислить среднее значение нескольких столбцов в R

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.