Как создать частотные таблицы в R (с примерами)


Таблица частот — это таблица, в которой отображаются частоты различных категорий. Этот тип таблицы особенно полезен для понимания распределения значений в наборе данных.

В этом руководстве объясняется, как создавать таблицы частот в R, используя следующий фрейм данных:

#make this example reproducible
set.seed(0)

#create data frame 
df <- data.frame(store= rep (c('A', 'B', 'C'), each = 3 ),
 sales= round (runif(9, 2, 6), 0 ),
 returns= round (runif(9, 1, 3), 0 ))

#view data frame 
df

 store sales returns
1 A 6 2
2 A 3 1
3 A 3 1
4 B 4 1
5 B 6 2
6 B 3 2
7 C 6 3
8 C 6 2
9 C 5 2

Односторонние таблицы частот в R

В следующем коде показано, как создать одностороннюю таблицу частот в R для хранилища переменных:

#calculate frequency of each store
table(df$store)

A B C 
3 3 3

Эта таблица просто говорит нам:

  • Store A появляется 3 раза во фрейме данных.
  • Store B появляется 3 раза во фрейме данных.
  • Store C появляется 3 раза во фрейме данных.

Двусторонние таблицы частот в R

В следующем коде показано, как создать двустороннюю частотную таблицу в R для переменных store и sales :

#calculate two-way frequency table
table(df$store, df$sales)

 3 4 5 6
 A 2 0 0 1
 B 1 1 0 1
 C 0 0 1 2

Эта таблица говорит нам:

  • Магазин А совершил 3 продажи в 2 разных случаях.
  • Магазин А совершил 4 продажи в 0 случаях.
  • Магазин А совершил 5 продаж в 0 случаях.
  • Магазин А совершил 1 продажу в 1 раз.

И так далее.

Трехсторонние таблицы частот в R

В следующем коде показано, как создать трехфакторную таблицу частот для всех трех переменных в нашем фрейме данных:

#calculate three-way frequency table
table(df$store, df$sales, df$returns)

, , = 1


 3 4 5 6
 A 2 0 0 0
 B 0 1 0 0
 C 0 0 0 0

, , = 2


 3 4 5 6
 A 0 0 0 1
 B 1 0 0 1
 C 0 0 1 1

, , = 3


 3 4 5 6
 A 0 0 0 0
 B 0 0 0 0
 C 0 0 0 1

Первая таблица показывает нам общий объем продаж по магазинам, когда количество возвратов было равно 1. Вторая таблица показывает нам общие продажи по магазинам, когда количество возвратов было равно 2. И третья таблица показывает нам общие продажи по store, когда количество возвратов было равно 3.

Обратите внимание, что R может создавать таблицы частот для еще более высоких размерностей (например, таблицы частот для 4-х сторон, таблицы частот для 5-ти сторон), но выходные данные могут стать довольно большими для более высоких размерностей.

На практике чаще всего используются односторонние и двусторонние частотные таблицы.

Дополнительные ресурсы

Как создавать таблицы в R
Как выполнить тест независимости хи-квадрат в R
Как выполнить критерий согласия хи-квадрат в R

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.