Как создать таблицу непредвиденных обстоятельств в R


Таблица непредвиденных обстоятельств (иногда называемая «перекрестными таблицами») — это тип таблицы, которая обобщает взаимосвязь между двумя категориальными переменными.

К счастью, в R легко создать таблицу непредвиденных обстоятельств для переменных с помощью функции сводной таблицы. В этом руководстве показан пример того, как это сделать.

Пример: Таблица непредвиденных обстоятельств в R

Предположим, у нас есть следующий набор данных, который показывает информацию о 20 различных заказах продуктов, включая тип приобретенного продукта и страну, в которой продукт был приобретен:

#create data
df <- data.frame(order_num = 1:20,
 product= rep (c('TV', 'Radio', 'Computer'), times =c(9, 6, 5)),
 country= rep (c('A', 'B', 'C', 'D'), times =5))

#view data
df

 order_num product country
1 1 TV A
2 2 TV B
3 3 TV C
4 4 TV D
5 5 TV A
6 6 TV B
7 7 TV C
8 8 TV D
9 9 TV A
10 10 Radio B
11 11 Radio C
12 12 Radio D
13 13 Radio A
14 14 Radio B
15 15 Radio C
16 16 Computer D
17 17 Computer A
18 18 Computer B
19 19 Computer C
20 20 Computer D

Чтобы создать таблицу непредвиденных обстоятельств, мы можем просто использовать функцию table() и указать переменные product и country в качестве аргументов:

#create contingency table
table <- table(df$product, df$country)

#view contingency table
table

 A B C D
 Computer 1 1 1 2
 Radio 1 2 2 1
 TV 3 2 2 2

Мы также можем использовать функцию addmargins() для добавления полей к таблице:

#add margins to contingency table
table_w_margins <- addmargins(table)

#view contingency table
table_w_margins

 A B C D Sum
 Computer 1 1 1 2 5
 Radio 1 2 2 1 6
 TV 3 2 2 2 9
 Sum 5 5 5 5 20

Вот как интерпретировать таблицу:

  • Значение в правом нижнем углу показывает общее количество заказанных товаров: 20.
  • Значения справа показывают суммы строк: всего было заказано 5 компьютеров, 6 радиоприемников и 9 телевизоров.
  • Значения в нижней части таблицы показывают суммы столбцов: Всего было заказано 5 товаров из страны A, 5 из страны B, 5 из страны C и 5 из страны D.
  • Значения внутри таблицы показывают количество конкретных товаров, заказанных в каждой стране: 1 компьютер из страны А, 1 радиоприемник из страны А, 3 телевизора из страны А и т. д.

Дополнительные ресурсы

Как усреднить по столбцам в R
Как суммировать определенные столбцы в R
Как вычислить среднее значение нескольких столбцов в R