Как применить эмпирическое правило в Excel


Эмпирическое правило , иногда называемое правилом 68-95-99,7, гласит, что для заданного набора данных с нормальным распределением:

  • 68% значений данных находятся в пределах одного стандартного отклонения от среднего.
  • 95% значений данных находятся в пределах двух стандартных отклонений от среднего значения.
  • 99,7% значений данных находятся в пределах трех стандартных отклонений от среднего значения.

В этом руководстве мы объясним, как применить эмпирическое правило в Excel к заданному набору данных.

Применение эмпирического правила в Excel

Предположим, у нас есть нормально распределенный набор данных со средним значением 7 и стандартным отклонением 2,2.На следующем снимке экрана показано, как применить эмпирическое правило к этому набору данных в Excel, чтобы определить, между какими значениями находятся 68% данных, между какими значениями находятся 95% данных и между какими значениями находятся 99,7% данных:

Из этого вывода мы видим:

  • 68% данных находятся между 4,8 и 9,2 .
  • 95% данных находятся между 2,6 и 11,4.
  • 99,7% данных находятся между 0,4 и 13,6 .

В ячейках столбцов F и G показаны формулы, которые использовались для нахождения этих значений.

Чтобы применить эмпирическое правило к другому набору данных, нам просто нужно изменить среднее значение и стандартное отклонение в ячейках C2 и C3. Например, вот как применить эмпирическое правило к набору данных со средним значением 40 и стандартным отклонением 3,75 :

Из этого вывода мы видим:

  • 68% данных находятся между 36,25 и 43,75.
  • 95% данных находятся между 32,5 и 47,5 .
  • 99,7% данных находятся между 28,75 и 51,25.

А вот еще один пример того, как применить эмпирическое правило к набору данных со средним значением 100 и стандартным отклонением 5 :

Из этого вывода мы видим:

  • 68% данных находятся между 95 и 105
  • 95% данных находятся между 90 и 110
  • 99,7% данных находятся между 85 и 115 .

Нахождение того, какой процент данных попадает между определенными значениями

Другой вопрос, который у вас может возникнуть: какой процент данных находится между определенными значениями?

Например, предположим, что у вас есть нормально распределенный набор данных со средним значением 100, стандартным отклонением 5, и вы хотите знать, какой процент данных попадает между значениями 99 и 105 .

В Excel мы можем легко ответить на этот вопрос, используя функцию = НОРМ.РАСП() , которая принимает следующие аргументы:

НОРМ.РАСП (x, среднее, стандартное_отклонение, кумулятивное)

куда:

  • x - это значение, которое нас интересует
  • среднее значение является средним значением распределения
  • standard_dev — стандартное отклонение распределения
  • cumulative принимает значение «TRUE» (возвращает CDF) или «FALSE» (возвращает PDF) — мы будем использовать «TRUE», чтобы получить значение кумулятивной функции распределения.

На следующем снимке экрана показано, как использовать функцию НОРМ.РАСП() , чтобы найти процент данных, попадающих между значениями 99 и 105 , для распределения со средним значением 100 и стандартным отклонением 5:

Мы видим, что 42,1% данных попадают между значениями 105 и 99 для этого распределения.

Полезные инструменты:

Калькулятор эмпирических правил
Эмпирическое правило (практические задачи)