Как создать частотные таблицы в R (с примерами)
Таблица частот — это таблица, в которой отображаются частоты различных категорий. Этот тип таблицы особенно полезен для понимания распределения значений в наборе данных.
В этом руководстве объясняется, как создавать таблицы частот в R, используя следующий фрейм данных:
#make this example reproducible
set.seed(0)
#create data frame
df <- data.frame(store= rep (c('A', 'B', 'C'), each = 3 ),
sales= round (runif(9, 2, 6), 0 ),
returns= round (runif(9, 1, 3), 0 ))
#view data frame
df
store sales returns
1 A 6 2
2 A 3 1
3 A 3 1
4 B 4 1
5 B 6 2
6 B 3 2
7 C 6 3
8 C 6 2
9 C 5 2
Односторонние таблицы частот в R
В следующем коде показано, как создать одностороннюю таблицу частот в R для хранилища переменных:
#calculate frequency of each store
table(df$store)
A B C
3 3 3
Эта таблица просто говорит нам:
- Store A появляется 3 раза во фрейме данных.
- Store B появляется 3 раза во фрейме данных.
- Store C появляется 3 раза во фрейме данных.
Двусторонние таблицы частот в R
В следующем коде показано, как создать двустороннюю частотную таблицу в R для переменных store и sales :
#calculate two-way frequency table
table(df$store, df$sales)
3 4 5 6
A 2 0 0 1
B 1 1 0 1
C 0 0 1 2
Эта таблица говорит нам:
- Магазин А совершил 3 продажи в 2 разных случаях.
- Магазин А совершил 4 продажи в 0 случаях.
- Магазин А совершил 5 продаж в 0 случаях.
- Магазин А совершил 1 продажу в 1 раз.
И так далее.
Трехсторонние таблицы частот в R
В следующем коде показано, как создать трехфакторную таблицу частот для всех трех переменных в нашем фрейме данных:
#calculate three-way frequency table
table(df$store, df$sales, df$returns)
, , = 1
3 4 5 6
A 2 0 0 0
B 0 1 0 0
C 0 0 0 0
, , = 2
3 4 5 6
A 0 0 0 1
B 1 0 0 1
C 0 0 1 1
, , = 3
3 4 5 6
A 0 0 0 0
B 0 0 0 0
C 0 0 0 1
Первая таблица показывает нам общий объем продаж по магазинам, когда количество возвратов было равно 1. Вторая таблица показывает нам общие продажи по магазинам, когда количество возвратов было равно 2. И третья таблица показывает нам общие продажи по store, когда количество возвратов было равно 3.
Обратите внимание, что R может создавать таблицы частот для еще более высоких размерностей (например, таблицы частот для 4-х сторон, таблицы частот для 5-ти сторон), но выходные данные могут стать довольно большими для более высоких размерностей.
На практике чаще всего используются односторонние и двусторонние частотные таблицы.
Дополнительные ресурсы
Как создавать таблицы в R
Как выполнить тест независимости хи-квадрат в R
Как выполнить критерий согласия хи-квадрат в R