Формула Спирмена-Брауна используется для прогнозирования надежности теста после изменения его длины.
Формула:
Прогнозируемая надежность = kr / (1 + (k-1)r)
куда:
- k : Коэффициент изменения длины теста. Например, если в исходном тесте 10 вопросов, а в новом тесте 15 вопросов, k = 15/10 = 1,5 .
- r : Надежность исходного теста. Обычно для этого мы используем Альфу Кронбаха , которая представляет собой значение в диапазоне от 0 до 1, причем более высокие значения указывают на более высокую надежность.
В следующем примере показано, как использовать эту формулу на практике.
Пример: как использовать формулу Спирмена-Брауна
Предположим, что компания использует тест из 15 пунктов для оценки удовлетворенности сотрудников, и известно, что тест имеет надежность 0,74.
Если компания увеличит длину теста до 30 пунктов, какова прогнозируемая надежность нового теста?
Мы можем использовать формулу Спирмена-Брауна для расчета прогнозируемой надежности:
- Прогнозируемая надежность = kr / (1 + (k-1)r)
- Прогнозируемая надежность = 2 * 0,74 / (1 + (2-1) * 0,74)
- Прогнозируемая надежность = 0,85
Новый тест имеет прогнозируемую надежность 0,85 .
Примечание.Мы рассчитали k как 30/15 = 2.
Предостережения относительно использования формулы Спирмена-Брауна
Основываясь на формуле Спирмена-Брауна, мы видим, что увеличение количества заданий в тесте на любое число повысит прогнозируемую надежность теста.
Например, предположим, что мы увеличили количество заданий в тесте по сравнению с предыдущим примером с 15 до 16. Тогда мы рассчитали бы k как 16/15 = 1,067.
Прогнозируемая надежность будет:
- Прогнозируемая надежность = kr / (1 + (k-1)r)
- Прогнозируемая надежность = 1,067 * 0,74 / (1 + (1,067-1) * 0,74)
- Прогнозируемая надежность = 0,752
Новый тест имеет прогнозируемую надежность 0,752 , что выше, чем надежность исходного теста 0,74 .
Используя эту логику, мы могли бы подумать, что увеличение длины теста за счет большого количества элементов — хорошая идея, потому что мы могли бы приближать надежность все ближе и ближе к 1.
Однако мы должны иметь в виду следующее:
1. Использование слишком большого количества предметов может вызвать эффект усталости.
Если в тесте слишком много вопросов, люди могут устать, отвечая на все больше и больше вопросов, что приведет к тому, что они будут давать менее надежные ответы по мере того, как тест затягивается.
2. Новые задания, добавленные в тест, должны быть одинаковой сложности с существующими заданиями.
Важно, чтобы, если мы решим увеличить продолжительность теста, убедиться, что новые элементы/вопросы, которые мы добавляем, имеют одинаковую сложность с существующими элементами, иначе прогнозируемая надежность не будет точной.
Дополнительные ресурсы
В следующих руководствах объясняются другие часто используемые термины в статистике:
Что такое внутренняя согласованность?
Что такое половинная надежность?
Что такое надежность повторных испытаний?
Что такое надежность параллельных форм?