Cтраница 2
Под адекватностью, или валидностью, теста понимают точное соответствие содержания задаваемой тестом пробы смыслу и содержанию выявляемого признака. Так, если речь идет о тестировании деятельности, скажем, II уровня, то задания, предлагаемые в тесте, должны быть разрешаемы в ходе деятельности II уровня и не разрешаемы путем использования способов деятельности более низкого уровня. [16]
Содержательная валидность называется также логической валидностью или валидностью по определению. [17]
Второе понимание смещения связано с конст-руктной валидностью тестов. Под таким заголовком Дженсен рассматривает конкретные задания в различных тестах. По мнению Дженсена, мы не должны доверять своим субъективным оценкам того, является ли данное задание неадекватным по, отношению к неграм. С объективной, статистической, точки зрения задание является смещенным по отношению к неграм, если белые считают его относительно легким, а негры - относительно сложным. Если задание А является самым-легким для белых и одновременно самым легким для негров, то по определению оно является несмещенным. И действительно, статистический анализ относительной сложности заданий для белых и для негров показывает, что они не являются существенно неадекватными в этом смысле. [18]
Чтобы иметь какие-то основания говорить о валидности системы, как минимум 20 % тестов должны быть на уровне прибыльности, считающемся значимым для данного рынка и системы. [19]
Понятно, что чем выше коэффициент валидности, тем более высоких результатов можно ожидать от профотбора. Это, конечно, не очень высокие коэффициенты. Вместе с тем имеются тесты специальных способностей, обладающие гораздо большей валидностью. Так, батарея тестов способностей1 ГАТБ, наиболее широко применяющаяся в профессиональной ориентации США, для ряда профессий имеет достаточно высокую валидность. [20]
Прогностическая ценность тестов заключается в их практической валидности. Каждый тест должен быть пригоден для прогноза хотя бы одного из качеств, необходимых тестируемому. Наиболее популярные психодиагностические тесты обладают высокой прогно-стичностью для многих ситуаций и видов деятельности. Методики расчета прогностической ценности аналогичны методикам расчета надежности. Однако в практике психодиагностики приемлемым считается применение тестов, валидность которых характеризуется коэффициентом 0 2 и выше. [21]
Содержательная валидность называется также логической валидностью или валидностью по определению. [22]
Заметим, что, по нашему мнению, валидность следует рассматривать как единое понятие, характеризующее, вообще говоря, степень несмещенности оценок того измерительного инструмента, которым является тест. [23]
Завершающим этапом разработки системы прогнозирования является определение ее валидности - того, насколько хорошо система работает, как выполняет то, для чего предназначена. Этот этап является, следовательно, контрольным испытанием системы. [24]
Тесты, которые действительно измеряют некоторые способности и валидность которых доказана реальным проявлением данной способности, тем не менее не являются научными в полном смысле слова. Дэвид Мак-Клелланд, утверждающий, что интеллектуальные тесты просто измеряют уровень школьных знаний, а не врожденную способность, ратует за тесты, основанные на реальной компетентности. [25]
Использование теории выживания наиболее приспособленных, чтобы придать валидность интеллектуальным тестам, возвращает нас к социальному дарвинизму. Разрабатывая интеллектуальные тесты для взрослых, Термен использовал контрастные группы из 30 бизнесменов, 150 мигрирующих безработных, 150 умственно отсталых молодых людей и 50 студентов. Этот отбор, должно быть, основан на предположении, что сама жизнь выделила этих индивидов по их врожденному интеллекту. Таким образом, тесты должны были отражать превосходство бизнесменов над безработными и студентов - над умственно отсталыми молодыми людьми. Термен не сообщает никаких подробностей о своем методе выбора заданий, отметив только, что взрослые, о которых из других источников было известно, что они обладают незаурядным интеллектом, имеют высокие показатели по тестам, приближаясь к высшему уровню для взрослых, и это справедливо независимо от того, имеют эти испытуемые хорошее образование или практически никакого. Тот факт, что необразованные бизнесмены имели такие же показатели, что и студенты высшей школы, очевидно, должен означать, что эти тесты отражают врожденный интеллект. [26]
Это зависит, в первую очередь, от валидности содержания и четкости формулировок тестовых заданий. Всякое отклонение от запланированной процедуры тестирования - непродуманный лимит времени, нечеткий инструктаж организаторов, недобросовестное выполнение заданий испытуемыми, отсутствие стимула к работе и многое другое - все это приводит к тому, что статистические критерии согласия полученных результатов с гипотетической моделью могут превысить допустимые значения. Это ухудшает валиДность теста и означает, что, помимр неизбежных случайных ошибок с характеристиками (3.3.4), (3.3.5), появляются еще и нежелательные дополнительные ошибки систематического характера. [27]
Структура познания. [28] |
Традиционная логика формирует критерии, которые гарантируют точность, валидность, непротиворечивость общих понятий, суждений и выводов. Ее основы заложены еще в Органоне Аристотеля в 4 в. [29]
Руководства по составлению тестов сообщают степень их надежности и валидности, из чего можно заключить, что тесты умственного развития являются надежным мерилом интеллектуальной способности, что подтверждается некоторыми критериями, независимыми от априорных условий тестирования. [30]