Нормальное распределение против стандартного нормального распределения: разница

Нормальное распределение против стандартного нормального распределения: разница

Нормальное распределение является наиболее часто используемым в статистике распределением вероятностей.

Он имеет следующие свойства:

  • Симметричный
  • колоколообразный
  • Среднее и медиана равны; оба расположены в центре распределения

Среднее значение нормального распределения определяет его местоположение, а стандартное отклонение определяет его разброс.

Например, на следующем графике показаны три нормальных распределения с разными средними значениями и стандартными отклонениями:

Стандартное нормальное распределение — это особый тип нормального распределения, где среднее значение равно 0, а стандартное отклонение равно 1.

На следующем графике показано стандартное нормальное распределение:

Пример стандартного нормального распределения

Как преобразовать нормальное распределение в стандартное нормальное распределение

Любое нормальное распределение можно преобразовать в стандартное нормальное распределение путем преобразования значений данных в z-показатели по следующей формуле:

z = (x – μ) / σ

куда:

  • x: индивидуальное значение данных
  • μ: среднее значение распределения
  • σ: стандартное отклонение распределения

Например, предположим, что у нас есть следующий набор данных со средним значением 6 и стандартным отклонением 2,152:

Мы можем преобразовать каждое отдельное значение данных в z-оценку, вычтя 6 из каждого значения и разделив на 2,152:

Преобразование нормального в стандартное нормальное распределение

Z-показатель говорит нам, сколько стандартных отклонений каждая точка данных находится от среднего значения. Например, первое значение данных «3» лежит на 1,39 стандартных отклонения ниже среднего.

Среднее значение этого распределения z-показателей имеет среднее значение, равное нулю, и стандартное отклонение, равное единице.

Как использовать стандартное нормальное распределение

Стандартное нормальное распределение обладает следующими свойствами:

  • Около 68% данных находятся в пределах одного стандартного отклонения от среднего
  • Около 95% данных находятся в пределах двух стандартных отклонений от среднего
  • Около 99,7% данных находятся в пределах трех стандартных отклонений от среднего значения.

Это известно как эмпирическое правило и используется для понимания распределения значений в наборе данных.

Например, предположим, что высота растений в определенном саду нормально распределена со средним значением 47,4 дюйма и стандартным отклонением 2,4 дюйма.

Согласно эмпирическому правилу, какой процент растений имеет высоту менее 54,6 дюймов?

Эмпирическое правило гласит, что для заданного набора данных с нормальным распределением 99,7% значений данных находятся в пределах трех стандартных отклонений от среднего. Это означает, что 49,85% значений находятся между средним значением и тремя стандартными отклонениями выше среднего.

В этом примере 54,6 находится на три стандартных отклонения выше среднего. Поскольку мы знаем, что 50 % значений данных находятся ниже среднего значения в нормальном распределении, в общей сложности 50 % + 49,85 % = 99,85 % значений попадают ниже 54,6.

Таким образом, 99,85% растений имеют высоту менее 54,6 дюймов.

Дополнительные ресурсы

Эмпирические проблемы практики правил
Калькулятор эмпирических правил
Как применить эмпирическое правило в Excel

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.