Как оценить среднее значение и медиану любой гистограммы


Гистограмма — это диаграмма, которая помогает нам визуализировать распределение значений в наборе данных.

По оси X гистограммы отображаются интервалы значений данных, а по оси Y указано, сколько наблюдений в наборе данных приходится на каждый интервал.

Хотя гистограммы полезны для визуализации распределений, не всегда очевидно, что представляют собой средние и медианные значения, просто взглянув на гистограммы.

И хотя невозможно найти точное среднее и срединное значения распределения, просто взглянув на гистограмму, можно оценить оба значения. В этом руководстве объясняется, как это сделать.

Как оценить среднее значение гистограммы

Мы можем использовать следующую формулу, чтобы найти наилучшую оценку среднего значения любой гистограммы:

Наилучшая оценка среднего: Σm i n i / N

куда:

  • m i : середина i -го бина
  • n i : частота i -го бина
  • N: общий размер выборки

Например, рассмотрим следующую гистограмму:

Наилучшей оценкой среднего значения будет:

Среднее значение = (5,5*2 + 15,5*7 + 25,5*10 + 35,5*3 + 45,5*1) / 23 = 22,89 .

Глядя на гистограмму, это кажется разумной оценкой среднего значения.

Как оценить медиану гистограммы

Мы можем использовать следующую формулу, чтобы найти наилучшую оценку медианы любой гистограммы:

Наилучшая оценка медианы: L + ((n/2 – F)/f) * w

куда:

  • L: Нижний предел средней группы
  • n: общее количество наблюдений
  • F: кумулятивная частота до средней группы
  • f: частота срединной группы
  • w: ширина срединной группы

Еще раз рассмотрим следующую гистограмму:

Наилучшей оценкой медианы будет:

Медиана = 21 + ((25/2 – 9)/10) * 9 = 24,15 .

Глядя на гистограмму, это также кажется разумной оценкой медианы.

Связанный: Как оценить стандартное отклонение любой гистограммы

Дополнительные ресурсы

Как найти среднее значение, медиану и моду в диаграммах «стебель-и-листья»
Как рассчитать среднее значение из таблиц частот
Когда использовать среднее значение против медианы