В этом руководстве объясняется, как работать с распределением хи-квадрат в R, используя следующие функции:
- dchisq : возвращает значение функции плотности вероятности хи-квадрат.
- pchisq : возвращает значение кумулятивной функции плотности хи-квадрат.
- qchisq : возвращает значение функции квантиля хи-квадрат.
- rchisq : генерирует вектор распределенных случайных величин хи-квадрат.
В следующих примерах показано, как использовать каждую из этих функций на практике.
dchisq
Мы часто используем функцию dchisq() с функцией curve() для построения распределения хи-квадрат с определенным числом степеней свободы.
Например, мы можем использовать следующий код для построения распределения хи-квадрат с 5 степенями свободы:
#plot Chi_Square distribution with 5 degrees of freedom
curve(dchisq(x, df= 5 ), from= 0 , to= 20 )

На оси X показаны значения статистики критерия Хи-квадрат, а на оси Y — соответствующее значение функции плотности вероятности.
Связанный: Как легко построить распределение хи-квадрат в R
pchisq
Мы часто используем pchisq()функция, чтобы найти p-значение , которое соответствует заданной статистике теста хи-квадрат.
Например, предположим, что мы проводим критерий независимости хи-квадрат и получаем тестовую статистику X 2 = 0,86404 с 2 степенями свободы.
Мы можем использовать функцию pchisq() , чтобы найти p-значение, соответствующее этой тестовой статистике:
#calculate p-value for given test statistic with 2 degrees of freedom
1-pchisq(0.86404, df= 2 )
[1] 0.6491964
Значение p оказывается равным 0,6491964 .
Мы также можем подтвердить, что это правильно, используя калькулятор отношения хи-квадрат к P-значению .
qchisq
Мы часто используем qchisq()Функция для нахождения критического значения хи-квадрат, которое соответствует заданному уровню значимости и степеням свободы.
Например, мы можем использовать следующий код, чтобы найти критическое значение хи-квадрат, которое соответствует уровню значимости 0,05 с 13 степенями свободы:
qchisq(p= .95 , df= 13 )
[1] 22.36203
Критическое значение оказывается 22,36203 .
Мы также можем подтвердить, что это правильно, используя Калькулятор критического значения хи-квадрат .
рчиск
Мы часто используем rchisq()функция для создания списка n случайных значений, которые следуют распределению хи-квадрата с заданными степенями свободы.
Например, мы можем использовать следующий код для создания списка из 1000 случайных значений, которые следуют распределению хи-квадрат с 5 степенями свободы:
#make this example reproducible
set. seed ( 0 )
#generate 1000 random values that follow Chi-Square dist with df=5
values <- rchisq(n= 1000 , df= 5 )
#view first five values
head(values)
[1] 8.369701 3.130487 1.985623 5.258747 10.578594 6.360859
Мы также можем использовать функцию hist( ) для создания гистограммы, чтобы визуализировать это распределение значений:
#create histogram to visualize distribution of values
hist(values)

По оси X показаны значения данных, а по оси Y — частота этих значений.
Дополнительные ресурсы
В следующих руководствах объясняется, как работать с другими дистрибутивами в R:
Нормальное распределение в R: dnorm, pnorm, qnorm и rnorm
Биномиальное распределение в R: dbinom, pbinom, qbinom и rbinom
Распределение Пуассона в R: dpois, ppois, qpois и rpois