Как рассчитать асимметрию и эксцесс в R

Как рассчитать асимметрию и эксцесс в R

В статистике асимметрия и эксцесс — это два способа измерения формы распределения.

Асимметрия — это мера асимметрии распределения. Это значение может быть положительным или отрицательным.

  • Отрицательная асимметрия указывает на то, что хвост находится в левой части распределения, которая простирается в сторону более отрицательных значений.
  • Положительная асимметрия указывает на то, что хвост находится на правой стороне распределения, которая простирается в сторону более положительных значений.
  • Нулевое значение указывает на то, что в распределении вообще нет асимметрии, что означает, что распределение совершенно симметрично.

Эксцесс — это мера того, является ли распределение тяжелым или легким хвостом по сравнению с нормальным распределением .

  • Эксцесс нормального распределения равен 3.
  • Если данное распределение имеет эксцесс меньше 3, говорят, что оно является игровым , что означает, что оно имеет тенденцию производить меньше и менее экстремальных выбросов, чем нормальное распределение.
  • Если данное распределение имеет эксцесс больше 3, говорят, что оно лептокуртическое , что означает, что оно имеет тенденцию производить больше выбросов, чем нормальное распределение.

Примечание. Некоторые формулы (определение Фишера) вычитают 3 из эксцесса, чтобы упростить сравнение с нормальным распределением. Используя это определение, эксцесс распределения будет больше, чем у нормального распределения, если бы он имел значение эксцесса больше 0.

В этом руководстве объясняется, как рассчитать как асимметрию, так и эксцесс заданного набора данных в R.

Пример: асимметрия и эксцесс в R

Предположим, у нас есть следующий набор данных:

data = c(88, 95, 92, 97, 96, 97, 94, 86, 91, 95, 97, 88, 85, 76, 68)

Мы можем быстро визуализировать распределение значений в этом наборе данных, создав гистограмму:

hist(data, col='steelblue') 
Асимметрия и эксцесс в R

Из гистограммы мы видим, что распределение кажется смещенным влево. То есть больше значений сосредоточено в правой части распределения.

Чтобы вычислить асимметрию и эксцесс этого набора данных, мы можем использовать функции skewness() и kurtosis() из библиотеки моментов в R:

library (moments)

#calculate skewness
skewness(data)

[1] -1.391777

#calculate kurtosis
kurtosis(data)

[1] 4.177865

Асимметрия оказывается равной -1,391777 , а эксцесс равен 4,177865 .

Поскольку асимметрия отрицательна, это указывает на то, что распределение асимметрично влево. Это подтверждает то, что мы видели на гистограмме.

Поскольку эксцесс больше 3, это указывает на то, что распределение имеет больше значений в хвостах по сравнению с нормальным распределением.

Библиотека моментов также предлагает функцию jarque.test() , которая выполняет проверку согласия, определяющую, имеют ли выборочные данные асимметрию и эксцесс, соответствующие нормальному распределению. Нулевая и альтернативная гипотезы этого теста следующие:

Нулевая гипотеза : набор данных имеет асимметрию и эксцесс, соответствующие нормальному распределению.

Альтернативная гипотеза : набор данных имеет асимметрию и эксцесс, которые не соответствуют нормальному распределению.

Следующий код показывает, как выполнить этот тест:

jarque.test(data)

 Jarque-Bera Normality Test

data: data
JB = 5.7097, p-value = 0.05756
alternative hypothesis: greater

Значение p теста оказывается равным 0,05756.Поскольку это значение не меньше α = 0,05, мы не можем отвергнуть нулевую гипотезу. У нас нет достаточных доказательств, чтобы сказать, что этот набор данных имеет асимметрию и эксцесс, которые отличаются от нормального распределения.

Полную документацию по библиотеке моментов вы можете найти здесь .

Бонус: Калькулятор асимметрии и эксцесса

Вы также можете рассчитать асимметрию для заданного набора данных с помощью статистического калькулятора асимметрии и эксцесса, который автоматически вычисляет как асимметрию, так и эксцесс для заданного набора данных.

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.