Cтраница 1
Валидность теста по содержанию означает, что задания теста полностью охватывают - и притом в нужной пропорции - все основные аспекты той области знания, подготовленность в которой этот тест оценивает. Составить тест, валидный по содержанию, могут только опытные специалисты - предметники, хорошо представляющие соответствующие учебные стандарты и программы, учебники, методику и т.п., а также владеющие основами тестологии. [1]
Валидность теста показывает, в какой мере он измеряет то психологическое качество ( свойство, способность и т.п.), для оценки которого предназначен. Тесты, не обладающие валид-ностью, не пригодны для практического применения. [2]
Вторая сторона валидности теста содержательная; под ней понимают соответствие теста содержанию опыта, усвоенного данным индивидом. Содержательно валиден такой тест, с помощью которого предъявляемые задания на деятельность ( по ее содержанию и качеству) безусловно выполнимы учащимся на основе предшествующего обучения. Содержательная валидность теста оценивается также сначала с помощью теоретического анализа ( экспертизы) -, а затем экспериментально. Теоретический анализ с остоит в сопоставлении содержания теста с учебными программами и пособиями, построенными на их основе, в сопоставлении требуемого качества усвоения с целями обучения. [3]
Известно, что валидность теста показывает, в какой мере тест или его методика измеряет то качество, для оценки котсь рого она предназначена. Понятие валидности применяется лишь совместно с понятием надежности. Надежность - необходимое условие валидности, но надежный тест иногда не может быть валидным, и наоборот, валидный тест не всегда надежен. [4]
Известно, что валидность теста показывает, в какой мере тест или его методика измеряет то качество, для оценки которого она предназначена. Понятие валид-ности применяется лишь совместно с понятием надежности. Надежность - необходимое условие валидности, но надежный тест иногда не может быть валидным, и наоборот, валидный тест не всегда надежен. [5]
Как уже не раз отмечалось, валидность теста и его заданий количественно оценивается соотношением между результатами тестирования и некоторым объективным критерием. С математической точки зрения, речь идет о связи между порядковой ( первичный балл теста) или дихотомной ( задание выполнено верно или неверно) переменной, с одной стороны, и непрерывной переменной ( критерий), с другой стороны. Однако часто критерий также является дихотомным ( успех или неудача при сдаче соответствующего вступительного экзамена в ВУЗ и т.п.), и все формулы данного раздела могут быть использованы для характеристики валидности. [6]
Тот факт, что эти три метода определения валидности теста как мерила общего интеллекта не достигают цели, вызывает к жизни четвертую, еще более темную и явно более субъективную теорию валидизации - так называемую конструктную еалидность. [7]
И, наконец, необходимо определить прогностическую эффективность - валидность теста. Это важнейший показатель, который, собственно, является решающим при вынесении суждения о практической пригодности теста. Трамвайная компания направила для проверки методики группу вагоновожатых, среди которых были лучшие работники, отлично зарекомендовавшие себя в отношении умелого предупреждения несчастных случаев, а с другой стороны, работники, которым грозило увольнение вследствие значительного числа несчастных случаев, произошедших по их вине. В итоге была зафиксирована очень тесная связь результатов тестовых испытаний с результатами практической деятельности. [8]
Таким образом, как уже отмечалось выше, надежность и валидность теста являются понятиями взаимосвязанными, но, конечно, отнюдь не идентичными. Скажем, повышение надежности теста не обязательно влечет за собой повышение валидности. [9]
Понятие корреляции находит широкое применение при количественном оценивании надежности и валидности теста и его заданий. [10]
Но эти критерии являются основой для составления теста, а не подтверждением валидности теста, построенного на каких-то иных принципах. Оправданием такого метода служит априорная идея, что успех в школе и в жизни определяется врожденным интеллектом, и, следовательно, тесты, дифференцирующие удачливых ( в школе и в жизни) и неудачливых людей, служат мерилом врожденного интеллекта. [11]
При этом валидность теста не может быть выше его надежности, а надежность - ниже валидности, т.е. надежность является верхней границей валидности. В современной психодиагностике обычно выделяют три основных вида валидности: содержательную ( логическую), эмпирическую и концептуальную. [12]
Контентная валидность предполагает, что мы понимаем измеряемую способность и можем анализировать ее составные части так, чтобы сконструировать тест, который точно испытал бы различные признаки этой способности. Реальная демонстрация способности - в предсказанной степени - должна быть, по-видимому, окончательным критерием валидности теста. Однако в отношении интеллектуального теста не существует общепринятого определения сферы общей когнитивной способности, которую должен измерять / Q. Так, содержание тестов определялось не путем анализа этой сферы поведения, общей когнитивной способности, а простым подбором заданий, которые устанавливают различия между детьми на основе их успеваемости в школе, но не входят непосредственно в школьные программы. [13]
Второй круг вопросов призван исследовать возможности самой генеральной совокупности заданий оценить именно то, в чем мы заинтересованы - уровень подготовленности испытуемых в конкретно определенной области знаний. Соответствующая характеристика теста называется валидностью. Высокая валидность теста означает, что тест свободен от субъективных факторов и беспристрастно измеряет именно то, для чего он предназначен. Мы упомянем здесь только две, с нашей точки зрения, важнейшие для педагогического тестирования: валидность по содержанию и по критерию. [14]
Под адекватностью, или валидностью, теста понимают точное соответствие содержания задаваемой тестом пробы смыслу и содержанию выявляемого признака. Так, если речь идет о тестировании деятельности, скажем, II уровня, то задания, предлагаемые в тесте, должны быть разрешаемы в ходе деятельности II уровня и не разрешаемы путем использования способов деятельности более низкого уровня. Оценка функциональной валидности теста может быть осуществлена путем теоретического анализа или экспериментально. [15]