Как создать частотные таблицы в R (с примерами)


Таблица частот — это таблица, в которой отображаются частоты различных категорий. Этот тип таблицы особенно полезен для понимания распределения значений в наборе данных.

В этом руководстве объясняется, как создавать таблицы частот в R, используя следующий фрейм данных:

#make this example reproducible
set.seed(0)

#create data frame 
df <- data.frame(store= rep (c('A', 'B', 'C'), each = 3 ),
 sales= round (runif(9, 2, 6), 0 ),
 returns= round (runif(9, 1, 3), 0 ))

#view data frame 
df

 store sales returns
1 A 6 2
2 A 3 1
3 A 3 1
4 B 4 1
5 B 6 2
6 B 3 2
7 C 6 3
8 C 6 2
9 C 5 2

Односторонние таблицы частот в R

В следующем коде показано, как создать одностороннюю таблицу частот в R для хранилища переменных:

#calculate frequency of each store
table(df$store)

A B C 
3 3 3

Эта таблица просто говорит нам:

  • Store A появляется 3 раза во фрейме данных.
  • Store B появляется 3 раза во фрейме данных.
  • Store C появляется 3 раза во фрейме данных.

Двусторонние таблицы частот в R

В следующем коде показано, как создать двустороннюю частотную таблицу в R для переменных store и sales :

#calculate two-way frequency table
table(df$store, df$sales)

 3 4 5 6
 A 2 0 0 1
 B 1 1 0 1
 C 0 0 1 2

Эта таблица говорит нам:

  • Магазин А совершил 3 продажи в 2 разных случаях.
  • Магазин А совершил 4 продажи в 0 случаях.
  • Магазин А совершил 5 продаж в 0 случаях.
  • Магазин А совершил 1 продажу в 1 раз.

И так далее.

Трехсторонние таблицы частот в R

В следующем коде показано, как создать трехфакторную таблицу частот для всех трех переменных в нашем фрейме данных:

#calculate three-way frequency table
table(df$store, df$sales, df$returns)

, , = 1


 3 4 5 6
 A 2 0 0 0
 B 0 1 0 0
 C 0 0 0 0

, , = 2


 3 4 5 6
 A 0 0 0 1
 B 1 0 0 1
 C 0 0 1 1

, , = 3


 3 4 5 6
 A 0 0 0 0
 B 0 0 0 0
 C 0 0 0 1

Первая таблица показывает нам общий объем продаж по магазинам, когда количество возвратов было равно 1. Вторая таблица показывает нам общие продажи по магазинам, когда количество возвратов было равно 2. И третья таблица показывает нам общие продажи по store, когда количество возвратов было равно 3.

Обратите внимание, что R может создавать таблицы частот для еще более высоких размерностей (например, таблицы частот для 4-х сторон, таблицы частот для 5-ти сторон), но выходные данные могут стать довольно большими для более высоких размерностей.

На практике чаще всего используются односторонние и двусторонние частотные таблицы.

Дополнительные ресурсы

Как создавать таблицы в R
Как выполнить тест независимости хи-квадрат в R
Как выполнить критерий согласия хи-квадрат в R