Что такое остатки Пирсона? (Определение и пример)

Что такое остатки Пирсона? (Определение и пример)

Остатки Пирсона используются втесте независимости хи-квадрат для анализа разницы между наблюдаемым количеством клеток и ожидаемым количеством клеток в таблице непредвиденных обстоятельств.

Формула для расчета остатка Пирсона :

r ij = (O ij – E ij ) / √ E ij

куда:

  • r ij : Невязка Пирсона для ячейки в i -м столбце и j -й строке
  • O ij : Наблюдаемое значение для ячейки в i -м столбце и j -й строке
  • E ij : ожидаемое значение для ячейки в i -м столбце и j -й строке.

Аналогичным показателем является стандартизированный (скорректированный) остаток Пирсона , который рассчитывается как:

r ij = (O ij – E ij ) / √ E ij (1-n i+ )(1-n +j )

куда:

  • r ij : Невязка Пирсона для ячейки в i -м столбце и j -й строке
  • O ij : Наблюдаемое значение для ячейки в i -м столбце и j -й строке
  • E ij : ожидаемое значение для ячейки в i -м столбце и j -й строке.
  • p i+ : Сумма строк, деленная на общую сумму
  • p +j : Сумма столбца, деленная на общую сумму

Стандартизованные невязки Пирсона обычно распределяются со средним значением 0 и стандартным отклонением 1. Любая стандартизованная невязка Пирсона с абсолютным значением выше определенных пороговых значений (например, 2 или 3) указывает на несоответствие.

В следующем примере показано, как вычислить остатки Пирсона на практике.

Пример: вычисление остатков Пирсона

Предположим, исследователи хотят использовать критерий независимости хи-квадрат, чтобы определить, связан ли пол с предпочтениями политических партий.

Они решают взять простую случайную выборку из 500 избирателей и опросить их на предмет предпочтения их политической партии.

В следующей таблице непредвиденных обстоятельств показаны результаты опроса:

|  |  |  |  |  | | --- | --- | --- | --- | --- | |  | республиканец | демократ | Независимый | Общий | | Мужской | 120 | 90 | 40 | 250 | | женский | 110 | 95 | 45 | 250 | | Общий | 230 | 185 | 85 | 500 |

Прежде чем мы вычислим остатки Пирсона, мы должны сначала вычислить ожидаемое количество для каждой ячейки в таблице непредвиденных обстоятельств. Для этого мы можем использовать следующую формулу:

Ожидаемое значение = (сумма строк * сумма столбцов) / сумма таблицы.

Например, ожидаемое значение для мужчин-республиканцев: (230*250) / 500 = 115 .

Мы можем повторить эту формулу, чтобы получить ожидаемое значение для каждой ячейки в таблице:

|  |  |  |  |  | | --- | --- | --- | --- | --- | |  | республиканец | демократ | Независимый | Общий | | Мужской | 115 | 92,5 | 42,5 | 250 | | женский | 115 | 92,5 | 42,5 | 250 | | Общий | 230 | 185 | 85 | 500 |

Затем мы можем вычислить остаток Пирсона для каждой ячейки в таблице.

Например, остаток Пирсона для ячейки, содержащей мужчин-республиканцев, будет рассчитываться как:

  • r ij = (O ij – E ij ) / √ E ij
  • r ij = (120 – 115) / √ 115
  • р ij = 0,466

Мы можем повторить эту формулу, чтобы получить остаток Пирсона для каждой ячейки в таблице:

|  |  |  |  | | --- | --- | --- | --- | |  | республиканец | демократ | Независимый | | Мужской | 0,446 | -0,259 | -0,383 | | женский | -0,446 | 0,259 | 0,383 |

Затем мы можем рассчитать стандартизированный остаток Пирсона для каждой ячейки в таблице.

Например, стандартизированный остаток Пирсона для ячейки, содержащей мужчин-республиканцев, будет рассчитываться как:

  • r ij = (O ij – E ij ) / √ E ij (1-p i+ )(1-p +j )
  • r ij = (120 – 115) / √ 115(1-250/500)(1-230/500)
  • р ij = 0,897

Мы можем повторить эту формулу, чтобы получить стандартизованный остаток Пирсона для каждой ячейки в таблице:

|  |  |  |  | | --- | --- | --- | --- | |  | республиканец | демократ | Независимый | | Мужской | 0,897 | -0,463 | -0,595 | | женский | -0,897 | 0,463 | 0,595 |

Мы видим, что ни один из стандартизованных остатков Пирсона не имеет абсолютного значения больше 3, что указывает на то, что ни одна из ячеек не способствует значительному отсутствию соответствия.

Если мы используем этот онлайн-калькулятор для выполнения критерия независимости хи-квадрат, мы обнаружим, что p-значение теста составляет 0,649198 .

Поскольку это p-значение не меньше 0,05, у нас нет достаточных доказательств, чтобы сказать, что существует связь между полом и предпочтениями политической партии.

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнить критерий независимости Хи-квадрат с использованием различных статистических программ:

Введение в критерий независимости хи-квадрат
Как выполнить тест независимости хи-квадрат в Excel
Как выполнить тест независимости хи-квадрат в R
Калькулятор критерия хи-квадрат независимости

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.