В статистике асимметрия и эксцесс — это два способа измерения формы распределения.
Асимметрия — это мера асимметрии распределения. Это значение может быть положительным или отрицательным.
- Отрицательная асимметрия указывает на то, что хвост находится в левой части распределения, которая простирается в сторону более отрицательных значений.
- Положительная асимметрия указывает на то, что хвост находится на правой стороне распределения, которая простирается в сторону более положительных значений.
- Нулевое значение указывает на то, что в распределении вообще нет асимметрии, что означает, что распределение совершенно симметрично .
Эксцесс — это мера того, является ли распределение тяжелым или легким хвостом по сравнению с нормальным распределением .
- Эксцесс нормального распределения равен 3.
- Если данное распределение имеет эксцесс меньше 3, говорят, что оно является игровым , что означает, что оно имеет тенденцию производить меньше и менее экстремальных выбросов, чем нормальное распределение.
- Если данное распределение имеет эксцесс больше 3, говорят, что оно лептокуртическое , что означает, что оно имеет тенденцию производить больше выбросов, чем нормальное распределение.
Примечание. Некоторые формулы (определение Фишера) вычитают 3 из эксцесса, чтобы упростить сравнение с нормальным распределением. Используя это определение, эксцесс распределения будет больше, чем у нормального распределения, если бы он имел значение эксцесса больше 0.
Сообщая об асимметрии и эксцессе данного распределения в официальной статье, мы обычно используем следующий формат:
Было обнаружено, что асимметрия [имя переменной] составляет -0,89, что указывает на то, что распределение было асимметричным влево.
Было обнаружено, что эксцесс [название переменной] составляет 4,26, что указывает на то, что распределение имеет более тяжелые хвосты по сравнению с нормальным распределением.
Сообщая о результатах, имейте в виду следующее:
- Округлите значения асимметрии и эксцесса до двух знаков после запятой.
- Удалите начальный 0 при сообщении значений (например, используйте 0,79, а не 0,79).
В следующем примере показано, как использовать этот формат на практике.
Пример: отчет об асимметрии и эксцессе
Предположим, мы анализируем распределение экзаменационных баллов среди студентов определенного университета.
Используя статистическое программное обеспечение, мы вычисляем значения асимметрии и эксцесса распределения:
- Асимметрия: -1,391777
- Эксцесс: 4.170865
Мы бы сообщали об этих значениях следующим образом:
Было обнаружено, что асимметрия результатов экзамена составляет -1,39, что указывает на то, что распределение было асимметричным влево.
Было обнаружено, что эксцесс экзаменационных баллов составляет 4,17, что указывает на то, что распределение имеет более тяжелый хвост по сравнению с нормальным распределением.
Наряду с отчетом об этих значениях асимметрии и эксцесса мы обычно включаем некоторые диаграммы для визуализации распределения значений, такие как гистограмма или блочная диаграмма, чтобы читатель также мог получить визуальное представление о распределении.
Дополнительные ресурсы
В следующих руководствах объясняется, как рассчитать асимметрию и эксцесс в различных статистических программах:
Как рассчитать асимметрию и эксцесс в R
Как рассчитать асимметрию и эксцесс в Python
Как рассчитать асимметрию и эксцесс в Google Sheets
В следующих руководствах объясняется, как сообщать о других статистических результатах:
Как сообщить о доверительных интервалах
Как сообщить о результатах дисперсионного анализа
Как сообщить о результатах регрессии
Как сообщить о корреляции Пирсона