1.3.7. Развитие психодиагностики в 1970-е гг
На протяжении 1970-х гг. психологическое тестирование продолжало подвергаться нападкам со стороны критиков, работающих как в этой области, так и вне ее. Основные направления критики были теми же, что и ранее: тесты обвиняли в том, что на их основе осуществлялась сегрегация детей, многих людей лишали возможности получения образования, в том числе профессионального. Отмечалось, что по многим тестам отсутствовали убедительные данные, касающиеся их валидности. Были высказаны предложения о полном отказе от проведения психологических тестов. При этом высказывалось мнение о том, что наблюдение за поведением человека в естественных условиях имеет более важное значение, чем тестирование. Менее ортодоксальные борцы с тестами предлагали создать новые тесты, которые были бы более валидны, нежели старые, и имели бы репрезентативные выборки стандартизации. Также предлагалось разрабатывать узкоспециализированные тесты с заранее определенными и ясными критериями валидизации.
Американская психологическая ассоциация
Отчет АПА повлек за собой немедленный ответ со стороны представителей того меньшинства психологов, которое выступало против тестов: «Психологическое тестирование исторически было квазинаучным инструментом для увековечивания расизма… оно выкопало выгребную яму… для ошибочных данных, которые усиливают эгоизм белых путем унижения черных людей и являются потенциальной угрозой геноцида черных» (статья Джексона, опубликована в журнале
Несмотря на неутихающую борьбу с психологическими тестами, их количество продолжало расти. Совершенствуются известные тесты интеллекта, в 1974 г. была опубликована новая редакция шкалы Векслера для детей
Роберт Л. Торндайк
Родился в 1910 г. Сын известного американского психолога Эдварда Торндайка. Получил степени бакалавра по математике Веслианского университета (1931), магистра психологии (1932) и доктора философии (1935) Колумбийского университета. Ассистент профессора психологии в Университете имени Вашингтона (1934–1936), позднее – в Колумбийском университете (1936–1939), там же работал как ассоциированный профессор (1940–1948) и профессор (1948–1976). В годы Второй мировой войны – майор воздушных сил, занимался отбором пилотов. В 1953 г. был президентом Психометрического общества. Основные исследования посвящены тестированию способностей. Известен как создатель теста когнитивных способностей (совместно с Э. Хаген), а также группового школьного теста умственных способностей (совместно с И. Поржем, 1954). Умер в 1990 г.
Усилия ученых также были направлены на разработку новых критериев интеллекта, прежде всего тех, которые не были бы связаны с культурой. Объектом пристального внимания некоторых ученых становятся появившиеся несколько ранее так называемые «культурно свободные» тесты, но реализуемые в них попытки освободиться от культурно-социальных факторов оказываются в конечном счете тщетными. Один из авторов таких тестов – Раймонд Кеттелл – в 1971 г., основываясь на исследованиях своего ученика Дж. Хорна (1965), представляет на суд научной общественности новую теорию, в которой пытается решить пресловутый вопрос о соотношении природного и приобретенного в интеллекте. Развивая взгляды Спирмена, он полагает, что
В работах известного английского психолога Ганса Айзенка продолжает проводиться мысль о том, что измеряемый тестами интеллект по меньшей мере на 80 % генетически детерминирован. Во многом итоговая работа этого ученого «Структура и измерение интеллекта»
Огромное значение, и не только в США, для подведения хотя бы предварительного итога бесконечных дискуссий, посвященных измерению
Леон Дж. Кэмин
Родился в 1924 г. Бакалавр (1949) и доктор философии (1950) Гарвардского университета. Работал в качестве профессора в Мак-Джилл и Королевском университетах. Профессор и руководитель департамента Мак-Мастер университета Онтарио (Канада, 1957–1968). С 1968 г. профессор Принстонского университета. Одним из первых доказал, что многие из исследований Барта, якобы подтверждающие генетическую предопределенность интеллекта, фальсификация. Много пишет о вреде и опасности теорий генетической обусловленности IQ. Одна из основных книг на эту тему – «Природа Интеллекта. Битва за разум!», содержащая полемику с Г. Айзенком и написанная совместно с ним, – переведена на русский язык (2002).
Сирил Людовик Барт
Родился в 1883 г. в Лондоне. Степени бакалавра (1907), магистра (1909) и доктора (1923) получил в Оксфордском университете. На формирование взглядов Барта оказало влияние знакомство с Ф. Гальтоном. Профессиональная деятельность связана в основном с Лондонским университетом (профессор педагогики – 1924–1931 гг., профессор психологии университетского колледжа – 1931–1950 гг.). Исследования Барта по генетике интеллекта, первоначально высоко оцененные благодаря значительным выборкам испытуемых, оказались, как было доказано, попыткой выдать желаемое за действительное. В данном случае желаемым было доказательство того, что интеллектуальное развитие человека наследственно детерминировано. Выходит в отставку в 1951 г., скончался в 1971 г.
Так была разоблачена, вероятно, одна из самых крупных мистификаций в психологической науке. Теория генетической предопределенности интеллекта, согласно одному из центральных положений которой имеющиеся тесты измеряют природный интеллект, оказалась зданием, выстроенным без фундамента. Тем не менее это лишенное опоры и давшее трещины здание продолжают «ремонтировать» до сих пор.
Большинство новых инструментов измерения личности были опросниками, многие из которых могли бы быть приспособлены для компьютерной обработки. Хотя и в этой области психодиагностики, как и можно было ожидать, критические голоса были сродни тем, которые раздавались почти 50 лет тому назад: информация при самоотчетах искажается, люди могут быть в неведении относительно особенностей собственного поведения, вопросы могут не затрагивать важные аспекты личности.
Из личностных опросников, появившихся в 1970-е гг., стоит отметить Опросник общего здоровья Д. Голдберга (1972) и разработанный Т. Миллоном Клинический многоосевой опросник (1977). Опросник Голдберга был предназначен для диагностики психического благополучия, эмоциональной стабильности. Один из вариантов опросника (1978) быстро получил популярность как своего рода мерило «качества жизни» и был переведен на 28 языков.
Миллон создает опросник на основе собственной теории, согласно которой расстройства личности трактуются как прототипы. Каждый прототип содержит множество разновидностей. Таким образом получается, что, например, шизоидные или депрессивные типы не существуют обособленно, а являются различными формами выражения ядра или прототипа личности. Опросник в конце 1970-х– начале 1980-х гг. начинает активно внедряться к клиническую психодиагностику, чему способствует его соответствие принятым за рубежом классификаторам психических расстройств
В психодиагностике, особенно клинической, по-прежнему продолжают пользоваться популярностью проективные методики, применение которых из-за часто недоказанной валидности вызывает дискуссии среди психологов. Некоторые клиницисты, такие как Хольт (Holt, 1971), продолжали утверждать, что результаты, полученные с помощью проективных техник, могут дать гораздо больше, нежели любая компьютерная распечатка, несмотря на то что они были получены эмпирическим путем.
Была предложена еще одна интерпретационная система для теста Роршаха (Ехпег, 1976). Ее характерной особенностью является психометрическая ориентация автора, стремящегося найти формулу для любого ответа испытуемого. К концу 1970-х гг. начинается активно проводимое Экснером внедрение этой системы в мировую роршахиану. Идет процесс постепенного вытеснения других схем интерпретации результатов по тесту Роршаха, о чем свидетельствуют соответствующие конгрессы и симпозиумы.
Характерной чертой развития психодиагностики в 1970-е гг. в развитых странах мира становится ее компьютеризация. Резко возрастает количество компьютерных версий тестов. Однако уже раздаются и первые призывы к тому, чтобы оценить последствия компьютеризации, изучить валидность и надежность тестов, предъявляемых и обрабатываемых с помощью компьютера. Возможности, предоставляемые компьютером, реализуются в так называемом адаптивном тестировании[16]. Адаптивное тестирование строится на основе разных процедурных моделей, но в конечном счете исследователь стремится из некоторого множества заданий предъявить испытуемому те, с которыми он может справиться.
В то же время в целом психологи уделяют тестированию все меньшую долю своего времени. В этом смысле показательны клинические психологи, которые всегда были активными потребителями разного диагностического инструментария. Так, если в 1959 г. в США около 44 % времени клинических психологов было уделено диагностированию с помощью тестов, то этот показатель снизился примерно до 24 % в 1976 г. Частично этот спад может объясняться возрастающей ролью психологов в психотерапии. Обучение психологическому тестированию стало занимать меньше места в аспирантских программах по психологии.
В 1974 г. в Монреале на Конгрессе Международной ассоциации прикладной психологии
В 1970-е гг. применительно к области измерения индивидуально-психологических различий наиболее употребительным становится термин, который к настоящему времени во многих странах Западной Европы и США почти полностью вытеснил ранее распространенный – психологическое тестирование. Это – психологическая оценка (см. об этом ниже).
В 1970 г. известный Институт психических измерений Буроса выпускает обширный справочно-обзорный том, посвященный личностным тестам
Заключая рассмотрение событий 1970-х гг., следует отметить и появление нового издания вышедших в 1966 г. «Стандартов для тестов». Изменилось их название. Они стали именоваться «Стандартами для образовательных и психологических тестов»
1.3.8. Развитие психодиагностики в 1980-е гг
В начале 1940-х гг. будущее психологического тестирования, во всяком случае в США, казалось отнюдь не светлым. Один из выпусков журнала
Количество тестов продолжало расти. Для диагностики личностных особенностей было разработано немало новых опросников, но исследователей по-прежнему беспокоила мысль о том, что ответы на вопросы могут быть сознательно или неосознанно фальсифицированы. Валидность оставалась наиболее уязвимым местом почти каждой диагностической методики, особенно проективной. Тем не менее годы критики относительно мало повлияли на статус проективных тестов. В первый десяток по популярности входили почти те же тесты, что и в прошлом десятилетии:
Большой интерес вызывало появление последней (четвертой) версии шкалы Стэнфорд-Бине (четвертой). Это были 15 субтестов с заданиями, расположенными в порядке возрастания трудности. Большое значение имело изменение отношения к тому, что измерял тест. Постепенно уходят в прошлое применительно к тестированию интеллекта термины «умственный возраст», «интеллект» и
Что дали эти изменения? Согласно некоторым критикам, они были попыткой преодолеть 20-летний спад в тестировании интеллекта (Spruill, 1987). Введение показателя СВБ в новую версию теста Стэнфорд-Бине принесло несомненный успех его разработчикам, правда, несколько омраченный тем, что в этом тесте стандартное отклонение было равно 16, в то время как большинство остальных шкал имело стандартное отклонение 15. Тем самым затруднялось сопоставление результатов, полученных с помощью разных тестов. Четвертая версия шкалы Стэнфорд-Бине была призвана погасить тот негативный эмоциональный заряд, носителем которого был /(^-показатель. В какой мере это удалось, сказать трудно, во всяком случае, понятие стандартного возрастного балла быстро нашло горячих сторонников среди тех, кому надоело обсуждать вопросы, связанные с наследуемым и приобретенным в интеллекте, отложив их решение до лучших времен.
Дальнейшее развитие получают векслеровские шкалы для измерения интеллекта. Незадолго до смерти его создателя выходит переработанный
Свежей струей в тестировании интеллекта была появившаяся в это десятилетие батарея для измерения интеллекта детей, разработанная в Университете Алабамы Аланом Кауфманом. Оценочная батарея Кауфмана для детей
Несомненным достижением психологов 1980-х гг., достижением, имеющим непосредственное отношение к диагностике способностей, было издание в период с 1982 по 1989 г. пятитомника «Успехи в психологии человеческого интеллекта»
Роберт Стернберг
Родился 8 декабря 1949 г. в Ньюарке (Нью-Джерси) в учительской семье. Интерес к психологии, особенно тестам интеллекта, возник у него еще в детские годы из-за того, что во время обучения в школе он всегда имел низкие показатели по этим тестам и не мог согласиться с подобным обстоятельством. Окончил Йельский университет со степенью бакалавра (1972), степень доктора философии получил в Стэнфордском университете (1975). Профессор факультета психологии Йельского университета. Имеет многочисленные публикации по различным направлениям психологической науки, один из наиболее часто цитируемых современных исследователей. Избирался президентом Американской психологической ассоциации. Наибольшую известность получила его триархическая теория интеллекта.
В эти годы еще одна теория пополняет анналы психологии интеллекта. Ее создатель Ховард Гарднер стремится доказать, что интеллект – явление многокомпонентное, а эти компоненты (по крайней мере пять) функционируют самостоятельно и отличаются друг от друга (подробнее см. далее).
Пополняется арсенал личностных опросников. Достоянием психодиагностов в 1989 г. становится
Ховард Гарднер
Родился 11 июля 1943 г. в Скрентоне (Пенсильвания) в семье немецких евреев, эмигрировавших в 1938 г. в США. Окончил Гарвардский университет со степенью бакалавра по специальности «Социальные отношения» (1965). Также обучался в Лондонской школе экономики (1965–1966), Гарвардской медицинской школе и Бостонском университетском центре по изучению афазий (1971–1972). Имеет степень доктора философии (1971). Трудовую деятельность начал в качестве учителя музыки (1958–1969). Работал в Бостонском госпитале психологом (1972), позднее – в Бостонской университетской школе медицины (1972–1975). В Гарвардском университете был руководителем продолжающегося и ныне проекта «Зеро» (1973). профессор этого университета (1986–1998). Профессор медицины (1979) и неврологии (1984) Бостонской университетской школы медицины. В настоящее время – профессор Гарвардской высшей школы образования (с 1998). Гарднер широко известен своими работами в области педагогической психологии, психологии искусства и творчества. Автор 23 книг, переведенных более чем на 20 языков мира. Создатель теории множественного интеллекта, представленной в книге «Структураума. Теория множественного интеллекта» (1983).
Восьмидесятые годы – годы значительного оживления в факторных исследованиях личности. На симпозиуме, посвященном факторным исследованиям личности (Гонолулу, 1980), в выступлениях Льювиса Гольдберга, Наоми Такемото, Андре Комрея и Джерси Виггинса обосновывалась пятифакторная модель личности, получившая название «Большой пятерки». Нельзя сказать, что ее авторы были полностью оригинальны в своих изысканиях (ср. с исследованиями, выполненными Терстоуном в 1930-х гг., и более поздними работами Р. Кеттелла), тем не менее модель вызвала значительный интерес. Пауль Коста и Роберт Макгри, ранее развивавшие трехфакторную модель личности (1976), добавляют к своим факторам нейротизма, экстраверсии и открытости опыту еще два: склонности к согласию и добросовестности. На основе этой модели ими создается первый опросник, предназначенный для диагностики «Большой пятерки» (1985).
Тем временем появляется множество компьютерных версий тестов, которые все чаще привлекают психологов. В течение 1983–1984 гг. результаты 300 тыс. тестовых исследований интерпретировались с помощью компьютера и высказывались предположения, что к 2000 г. практически все психологические тесты будут автоматизированы. Однако если в 1970-е гг. многие психологи оказались очарованы возможностями компьютеров и не особенно прислушивались к голосам, заявлявшим о проблемах, которые приносит с собой компьютеризированное тестирование, в это десятилетие предостережения звучат все чаще, носят более обоснованный характер и не остаются без внимания научной общественности. Указывается на необходимость продолжения исследований по определению валидности многих из автоматизированных тестов и полученных таким образом интерпретаций (Groth-Marnat и Shumaker, 1989). Компьютерные интерпретации, как оказалось, нуждаются в периодическом пересмотре. Также отмечается то, что должны быть решены вопросы, связанные с квалификацией, с одной стороны, разработчиков программного обеспечения, а с другой – психологов, проводящих компьютерное тестирование. Компьютерные интерпретации справедливо характеризуются как такие, которые грешат расплывчатыми утверждениями общего характера и тем самым применимы почти к каждому человеку.
В 1984 г. появляется еще одно справочное издание, посвященное тестам, – «Критика тестов»
Переиздание Американской психологической ассоциацией в 1985 г. «Стандартов для образовательного и психологического тестирования»
В 1982 г. Любин, Ларсен и Матараццо опросили более 200 психологов, работавших в психиатрических больницах, общинных центрах психического здоровья, школах для умственно отсталых, психологических консультациях и больницах для ветеранов. Психологов просили расставить в порядке убывания наиболее часто используемые ими тесты. В 1988 г. Краг и Горовитц провели похожий опрос. Они предложили руководителям тренингов 38 различных учреждений (клиники психического здоровья, учреждения для умственно отсталых, психиатрические заведения и больницы для ветеранов) назвать применяемые ими тесты.
Как видно, оба списка очень похожи, и тесты, указанные в них, используются давно. Этот факт позволяет утверждать, что практика применения психологических тестов остается достаточно стабильной.
1.3.9. Развитие психодиагностики в 1990-е гг
Опубликованный в 1992 г. одиннадцатый выпуск Ежегодника психических измерений содержал сведения о 477 коммерческих тестах (тесты, которые в отличие от исследовательских изданы и предназначены для продажи специалистам)[17]. Наибольшая часть этих тестов предназначалась для диагностики личности (28,3 %), тогда как на исследование интеллекта были ориентированы всего 4,6 % от общего числа новых тестов (напомним, что каждый новый выпуск Ежегодника не повторяет ранее опубликованные тесты, за исключением случаев их переиздания или рестандартизации).
Среди тестов для диагностики интеллекта по-прежнему первые по популярности места занимают предназначенные для разных возрастных групп шкалы Векслера. Эти шкалы совершенствуются: так в 1991 г. выходит третья редакция шкалы для детей (
Продолжают разработку новых тестов для измерения интеллекта А. Кауфман и Н. Кауфман. В 1990 г. был опубликован «Краткий тест интеллекта Кауфмана», состоящий из одного вербального и одного невербального субтестов и охватывающий возрастной диапазон от 4 до 90 лет. В 1993 г. этими исследователями предложен «Тест интеллекта подростков и взрослых Кауфмана». При разработке теста была предпринята попытка интегрировать теорию текучего и кристаллизованного интеллекта со взглядами других исследователей. Отличительной чертой теста является множество необычных и интересных заданий, привлекающих внимание обследуемых.
Следует упомянуть и о развитии в США «Британской шкалы способностей», о которой уже упоминалось ранее. Ее пересмотренная и расширенная версия под названием «Дифференциальные шкалы способностей» была издана Элиоттом в 1990 г. В этих шкалах автор избегает понятия интеллекта и предпочитает говорить о специфических способностях. Теоретическое обоснование шкал носит эклектический характер; используется однопараметрическая модель теории «задание-ответ», что позволяет градуировать каждое задание по уровню трудности (используется стратегия адаптивного тестирования). В целом шкалы благодаря множеству психометрических новшеств характеризуются высокой сложностью проведения и обработки результатов, что может препятствовать их распространению. Новые взгляды на измерение познавательной деятельности нашли свое отражение и в «Системе когнитивной оценки», разработанной Дж. Дасом и Наглиери (1997). Задания, входящие в тест, определяющий так называемый когнитивный статус, предназначены для измерения основных познавательных функций, участвующих в научении, но, как предполагается, не зависимых от школьного обучения. Тест создан в соответствии с авторской моделью интеллекта, полагающей планирование, внимание, симультанную и сукцессивную обработку информации его важнейшими составляющими.
Джон Б. Кэрролл
Родился 5 июня 1916 г. Получил степень бакалавра Веслианского (Wesleyan) университета (1937), позднее учился в Лингвистическом институте Мичиганского университета (1937). Степень доктора философии по общей психологии присуждена в Миннесотском университете (1941). Кэрролл был студентом Флоренс Гуденаф. Работал в университете штата Индиана (1942–1943). Чикагском (1943–1944) и других университетах США, Гарвардской высшей школе образования (1949–1967), позднее стал профессором психологии Университета Северной Каролины (1974–1982) там же руководил психометрической лабораторией имени Терстоуна(1974–1979). Почетный профессор этого университета с 1982 г. Внес значительный вклад в развитие лингвистики, обучение иностранным языкам и исследование индивидуальных различий в когнитивных способностях. Создатель трехуровневой (иерархической) модели интеллекта, в завершенной форме представленной им в книге «Когнитивные способности человека: обзор факторно-аналитических исследований» (1993).
Не остаются забытыми и тесты для оценки познавательной деятельности младенцев. Среди наиболее интересных и вызвавших внимание исследователей можно назвать Тест интеллекта младенцев Фэгена
В области теории обращает на себя внимание концепция интеллекта, разрабатываемая американским психологом Джоном Кэрроллом. Она представляет собой еще один «иерархический взгляд» на структуру интеллекта (подробнее см. далее).
Интерес к проблеме интеллекта в том виде, как он измеряется тестами, оказался весьма устойчивым, и своеобразным итогом более чем двадцатилетних исследований в этой области была публикация «Энциклопедии человеческого интеллекта»
Процессы развития и использования личностных тестов не были столь дискуссионными в этот период. Незначительно сравнительно с прошлым десятилетием изменяется ситуация с популярностью личностных опросников. Анализ данных, содержащихся в
В 1992 г. публикуется вариант
В 1990-е гг. в психодиагностике продолжается изучение роли ситуаций в поведении индивидуума. Естественно, что по большей части это относится не к обычным житейским ситуациям – основное внимание уделяется анализу поведения человека в сложных, стрессовых условиях. Разрабатываются и соответствующие диагностические инструменты. К изучаемым феноменам в первую очередь относятся посттравматические стрессовые расстройства, для измерения которых создаются многочисленные опросники. Все большее значение придается разработке инструментов, позволяющих оценить особенности реагирования на сложную ситуацию (защитные механизмы, совладающее поведение и др.).
Не теряют своего авторитета среди психологов и проективные тесты. Наряду с появлением новых идет развитие уже известных. Преобладающей схемой интерпретации результатов по тесту Роршаха становится та, которая развивается в работах Дж. Экснера. В 1993 г. Экснер публикует нормативные данные, опирающиеся на обследование 700 нормальных взрослых и 1390 детей в возрасте от 5 до 16 лет. Ирвинг Вейнер, известный специалист по тесту Роршаха, отмечает, что за последние два десятилетия эта популярная методика превратилась в стандартный и надежный с точки зрения психометрии инструмент оценки личности, применение которого позволяет сделать множество обоснованных выводов. Сказанное относится к разработкам Дж. Экснера, носящим, как уже отмечалось ранее, отчетливую психометрическую направленность. В то же время остаются и сторонники качественного анализа результатов по тесту Роршаха, хотя их становится все меньше и меньше. Проходят очередные международные конгрессы, посвященные тесту Роршаха и проективным методикам (XIV – в 1990-м, XV – в 1996-м, последний в это десятилетие XVI конгресс состоялся в 1999 г. в Амстердаме). Выходит в свет 23-й том пользующейся большой популярностью среди специалистов по проективным методикам «Роршахианы» (1999).
Сравнительный анализ популярности проективных тестов и личностных опросников показывает, что и за рамками клинической психологии проективная техника не утратила своего значения. Проведенный в США в 1990 г. опрос 64 руководителей консультационных психологических программ по вопросу использования тренинга личностной оценки при подготовке психологов-консультантов показал, что 45 % опрошенных используют в своих программах так называемую «объективную» личностную оценку, а 32 % – проективную. Для проведения «объективной» личностной оценки чаще всего используют
Начало 1990-х гг. отмечено значительным возрастанием числа тестов, использование которых предполагает наличие компьютера. Институт психических измерений Буроса сообщал о том, что количество таких тестов возрастает с 4 в 1965 г. до 400 – в 1990 г. В то же время в большинстве своем это компьютеризированные уже известные тесты, а не тесты, специально разработанные с учетом возможностей компьютера (компьютерные тесты). К концу 1990-х гг. можно констатировать определенный спад интереса к компьютеризированным тестам, и не только потому, что зачастую возникают проблемы с их надежностью и валидностью. Многие психологи, прежде всего работающие в клинике, не удовлетворены предлагаемыми программами интерпретации получаемых результатов, вполне обоснованно полагая, что данная работа – задача диагноста.
В 1990-е гг. Центр психических измерений Буроса[19] начинает очередной проект – публикацию реферативных настольных книг по отдельным направлениям тестирования. В 1994 г. выходит том, посвященный психологической оценке в школе. Своеобразным подведением итогов развития психодиагностики в 1990-е гг. стали публикации очередного, тринадцатого, выпуска «Ежегодника психических измерений» (1998), в котором сообщается о 370 новых тестах (в 1999 г. выходит приложение к этому Ежегоднику) и двухтомного
Все возрастающая заинтересованность правительственных органов США в применении психологических тестов приводит в 1993 г. к образованию Совета по тестированию и оценке. Главная задача этого Совета состоит в разъяснении разнообразным правительственным службам значения психологических тестов как орудий государственной политики. Опубликованные Советом отчеты свидетельствуют о том, что наибольшее значение американское правительство придает тестированию в области образования, а также совершенствованию имеющихся тестов.
В 1999 г. вышло новое издание «Стандартов образовательного и психологического тестирования». В них появились существенные изменения в формулировании понятия валидности теста, что вызвало неоднозначную реакцию среди психологов[20].
Итак, «1990-е гг. свидетельствовали о неуклонном повышении и расширении интереса к психологическому тестированию. На это указывает как разработка новых тестов, часть которых отражает принципиально новые подходы, так и непрекращающиеся исследования существующих тестов наряду с систематическим пересмотром их более ранних версий»[21]. Добавим также, что по завершению этого десятилетия закончился более чем столетний период развития психодиагностики. За это время значительный прогресс был достигнут в разработке методик, с помощью которых пытались измерять едва ли не все возможные проявления индивидуальности. Психодиагностика прошла как через пики популярности и признания, так и по низинам яростной критики и даже забвения в отдельных странах мира. В новое тысячелетие эта наука, как и вся психология, вошла с множеством нерешенных проблем, но с обоснованной убежденностью в возможности их решения.
1.3.10. Развитие психодиагностики в первом десятилетии XXI в
Чем ближе та точка в истории психодиагностики, которая называется «сегодня», тем труднее говорить о событиях, происходящих в этой области психологического знания, выделить наиболее значительные из них. И в этом нет ничего удивительного. История – это, как хорошо известно, рассказ о прошедшем, узнанном. Когда же события, о которых нужно было бы писать, в силу их близости к настоящему времени автору не известны, а известные еще не получили должной оценки и понимания, что возможно только по истечению некоторого времени, складывается весьма своеобразная ситуация, подразумевающая возможность переосмысления этой истории. Эту возможность мы и оставляем за собой на будущее.
На самом рубеже XX и XXI вв. появляются три тома «Ежегодника психических измерений» (2001, 2003, 2005, 2007; соответственно 14, 15, 16 и 17 тома), что само по себе знаменательно, поскольку ранее эти издания не выходили столь часто и регулярно. Последний, 17-й, том дает информацию о 209 новых тестах.
Определенный прогресс заметен в области тестирования интеллекта. Прежде всего следует отметить появление новых редакций популярнейших шкал Векслера для детей и подростков
Не остается вне изменений и «Оценочная батарея Кауфмана для детей»
Определенные успехи достигнуты также в области измерения социального и эмоционального интеллекта (см. гл. 4).
В России прошла первая с 1970-х гг. дискуссия о тестах интеллекта, которая была отражена на страницах журнала «Психология. Журнал Высшей школы экономики». Привлекшая наиболее известных российских и украинских специалистов в области психодиагностики, дискуссия показала, что существует значительный интерес к надежным и валидным психологическим тестам, в частности тестам интеллекта. В то же время следует признать и отсутствие достаточно развитой психодиагностической (тестовой) инфраструктуры как в России, так и на Украине. Тесты не могут успешно применяться, если нет их разработчиков, соответствующих исследовательских лабораторий, специализированных издательств, действующих, а не декларативных документов об этических принципах их использования, наконец, без сертификации и аттестации тех, кто с ними работает.
В первое десятилетие XXI в. стал значительно пополняться перечень личностных опросников. Упомянем лишь наиболее известные. К ним можно отнести Опросники Бека для молодежи
Другой опросник – Кларка-Бека обсессивности-компульсивности
Прошедшее в 2000–2001 гг. в США на страницах журнала «Psychological Science in the Public Interest» (имеющего значительно более широкий круг читателей, нежели специализированные издания) очередное обсуждение научного статуса проективных методик вновь продемонстрировало, что противостояние между противниками и сторонниками проективного подхода не только сохраняется, но и укрепляется. На этот раз предметом обсуждения были три основные, наиболее известные и часто используемые в клинике методик: тест Роршаха, тест тематической апперцепции (ТАТ) и рисунок фигуры человека. Валидность показателей этих методик была подвергнута (в который раз!) сомнению. Сторонники проективного подхода доказывали его обоснованность в решении ряда клинико-диагностических задач. В этой дискуссии отразились крайние точки зрения и нежелание искать компромисс между объективным и проективным подходами к диагностике личности (об этом подробнее см. в гл. 6).
В первые годы нового столетия прошли два международных конгресса по тесту Роршаха и другим проективным методикам (Рим, 2002; Барселона, 2005), увидели свет новые тома «Роршахианы». Основной темой 25 тома ежегодника (2002) были проблемы диагностики психической травмы, 26 (2004) – кросс-культурные исследования, а в 27 томе (2005) рассматривались вопросы взаимосвязи данных, получаемых с помощью методики Роршаха, с факторами «Большой пятерки».
Достаточно важным событием стала публикация книги «Позитивная психологическая оценка: руководство по моделям и измерениям» (2003). В ней американские, канадские, немецкие и английские психологи с разных сторон рассматривают проблему перехода от диагностики, выраженной в понятиях расстройств, нарушений, к диагностике, описываемой понятиями позитивных перспектив личности. В России вышли два учебника по психодиагностике, а в 2007 г. появилось новое, третье, издание «Словаря-справочника по психодиагностике», подготовленное издательством «Питер». В Москве прошли конференции «Психологическая диагностика и тестирование персонала» (2004, 2005), консолидирующие психологов-диагностов СНГ, работающих с персоналом различных государственных и негосударственных учреждений.
С целью выяснения популярности тестов повторенный в 2006 г. опрос российских психологов (о первом опросе см. на с. 103) вывел на первое место личностный опросник Кэттелла, второе место занял тест Люшера, а третье –
Среди событий, имеющих значение для всех психодиагностов, необходимо упомянуть и о новом издании Американской психологической ассоциации – ее труде «Этические принципы психологов и кодекс поведения» (2002).
1.4. Тестирование в образовании
Сразу оговоримся, что к собственно психологическим тесты образовательные (или тесты достижений) не относятся, поскольку направлены прежде всего на оценку степени усвоения того или иного учебного материала. Тем не менее разработка психологических тестов во многом влияла и на развитие инструментов оценки знаний, эти исследования шли рука об руку, в них участвовали психологи, а поэтому в истории психодиагностики нельзя обойти вниманием тестирование в сфере образования, которая была и остается основным потребителем психологических тестов. А. Анастази справедливо замечает, что в тестах достижений основной интерес сосредоточен на том,
Самые ранние сведения о проверке успеваемости в европейской школе датируются примерно 1200 г. В это время Университет Болоньи проводил первый устный экзамен на получение степени доктора философии. Это был единственный экзамен, который в то время сдавали студенты, и обычно продолжался он около недели. Интересно, что экзамен этот проходил в таверне, и студенты быстро установили традицию угощать едой и напитками как своих коллег, так и преподавателей. Естественно, что экзамен нередко переходил в пьяные ссоры и потасовки. Почти 500 лет такой устный экзамен оставался единственным видом «теста» на академическую успеваемость. В 1700 г. в Кембриджском университете устный экзамен был введен и для получения более низкой степени магистра. В начале XIX в. письменные экзамены становятся в Европе общепринятыми. В США первые письменные экзамены были введены в Массачусетсе в 1845 г.
Считается, что первопроходцем в области педагогического измерения был Реверенд Джордж Фишер, директор школы в Англии. Еще в начале 1860-х гг. этот педагог понял необходимость установления стандартов успеваемости в обучении. Для использования в своей школе Фишер разработал так называемые «книги шкал». Он присваивал значение единицы для выражения высшего показателя, которого возможно достичь, и значение пяти для обозначения наименьших достижений в таких предметах, как правописание, математика, навигация, библия, французский язык, общая история, рисование и др.
Американский врач и психолог Дж. М. Райе (1857–1934) заслуживает признания как первый из тех, кто начал массовое тестирование в школе. Он изобрел три различных теста на правописание, которые использовал для проверки примерно 33 тыс. учеников 4-8-х классов в 21 городе США. Отчет о результатах этого исследования был издан в 1897 г.
Этот отчет произвел фурор среди американских преподавателей. Одним из выводов исследования было то, что количество времени, проведенного в ежедневной тренировке по правописанию, не имеет непосредственной связи с успехами в нем (много позже по оригинальным данным Райса был рассчитан коэффициент корреляции, равный -0,12) Из этого следовало заключение о том, что детей нужно не столько учить правописанию, сколько развивать их ум. Впоследствии Райс направил свое внимание на поиск инструментов, позволяющих оценить уровень овладения арифметикой. В 1902 г. он составил серию арифметических тестов для 4-8-х классов и провел их примерно с 6 тыс. учащимися из 18 школ, расположенных в 7 городах. На следующий год был подготовлен языковой тест в форме презентации рассказа, по которому ученики должны были писать сочинение. Более чем 8 тыс. учащихся из 9 различных городов писали такие сочинения. Они были оценены Райсом по изобретенной им пятибалльной шкале, которой, как известно, предстояло большое будущее. Однако работы Райса, несмотря на их новаторский характер, не были достойно оценены его современниками. Отцом измерения в образовании в США был признан Э. Торндайк.
Проявляя интерес к статистике, Торндайк совместно с Фоксом в 1903 г. опубликовал исследование, в котором были разработаны и использованы несколько тестов, связанных с арифметическими операциями. Целью их исследования было изучение взаимоотношений между различными арифметическими операциями. В том же году Торндайк издает книгу под названием «Образовательная психология»
Публикация этой книги ознаменовала появление новой области – образовательной психологии, в которой нашлось место и проблемам измерения. Разработке этих проблем посвящена ставшая классической работа Торндайка «Введение в теорию умственных и социальных измерений»
В декабре 1909 г. Торндайк представил научной общественности свою широко известную Шкалу почерка. Эта шкала, по сути дела, была первым инструментом для измерения продукта образования. Торндайк собрал образцы почерков, которые классифицировались экспертами как различные по качеству. Для того чтобы образовать шкалу, он расположил эти образцы в порядке возрастания их качества. Шкала почерка Торндайка положила начало этапу стремительного развития тестов по многим образовательным предметам. Этому в немалой степени способствовал приток в США иммигрантов, обусловивший увеличение набора учащихся. Также возрастала необходимость в квалифицированных рабочих, что требовало их обучения и, конечно, развития инструментов для оценки его эффективности. К этому времени относится разработка арифметических тестов С. Стоуном, одним из последователей и учеников Торндайка. Широко известные как Стандартные тесты Стоуна, они внесли вклад в образовательное измерение и стали основой для исследований другого ученика Торндайка – С. А. Куртиса. Результатом усилий Куртиса стала Серия арифметических тестов А (1909). Позднее появляется значительно усовершенствованная серия В (1914).
При проверке бесплатных школ Нью-Йорка в 1910–1911 гг. впервые были использованы тесты для измерения успеваемости учеников как средство оценки эффективности школьной системы. Среди используемых в ходе этой проверки тестов (было обследовано более 30 тыс. учеников) были и тесты Куртиса. Они же были задействованы в последующих широкомасштабных исследованиях в Бостоне, Кливленде, других крупных городах США.
Среди других подготовленных Торндайком исследователей, внесших свой вклад в развитие образовательного измерения, был Б. Р. Букингем. В 1913 г. он разработал шкалу правописания, которая представляла новый тип измерительного инструмента. Уровни сложности 50 слов, отобранных для шкалы, были определены на основании процента правильных ответов учеников различных классов. После этого слова были расставлены в шкале в соответствии с их уровнем сложности. В шкалу вошли также 125 вспомогательных слов. Теоретической основой теста Букингема было положение о том, что способность к правописанию может быть измерена тем уровнем трудности, которого может достичь ученик по этой шкале. Принцип построения шкалы Букингема был использован Л. П. Айресом в его Шкале правописания, а также другими специалистами по образовательному измерению при создании тестов для разных предметных областей: С. Вуди – для тестов на математические операции; X. Г. Хотсом – для алгебры; В. А. С. Хен-моном и X. А. Брауном – для латыни; М. Р. Трабу – для языкознания, а также М. Дж. Ван-Вагененом – для тестов по истории.
Результаты тестовых исследований в крупных городах побуждают руководство школ к соответствующим нововведениям. В «Двенадцатом ежегоднике Национального общества по исследованию образования» (1913) впервые были даны официальные рекомендации по использованию тестов в школе. Руководство школ начинает активно использовать статистические методы. В университетах были разработаны специальные курсы для обучения статистическим методам будущих администраторов и технических специалистов в области образования. Основным учебником служило переработанное Торндайком «Введение в теорию умственных и социальных измерений» (1913).
Для содействия изучению работы школ независимыми организациями, городскими и окружными школьными департаментами, государственными отделами общественного обучения, а также университетскими центрами были созданы бюро образовательных исследований под руководством выдающихся специалистов в развитии измерения. Это обеспечило прогресс в области школьных измерений. Этими бюро предоставлялись услуги по обеспечению тестами персонала школ, проводилась стандартизация имеющихся тестов, создавались новые. Администрация и учителя школ знакомились с тестами и техникой их проведения. Продажа и использование тестов, по мнению Ашбо (1918), выросли до беспрецедентных размеров. Этот автор сообщал о том, что в 1916 г. было реализовано около 900 тыс. копий одного из популярных тестов, а ежегодная продажа некоторых других перевалила за 100 тыс. экземпляров. Использование тестов не ограничивалось пределами США. Они рассылались во многие страны мира. К 1918 г. В. С. Монро представил список 109 стандартизированных тестов на измерение успеваемости, которые уже были на рынке, включая 84 теста, созданных для младших классов (до 8-го класса включительно), а также 25 тестов – для старших классов. Большинство тестов для начальной школы составляли тесты на измерение успехов в математике и только один тест оценивал эффективность обучения рисованию. Тесты по иностранному языку лидировали среди тех, которые предназначались для старшеклассников.
Накануне Первой мировой войны тесты для измерения интеллекта были признаны как наиболее важные инструменты образовательной психологии. Интеллект стал особой областью исследования в образовательной психологии, и лидером этого направления также был Торндайк. В 1918 г. Торндайк формулирует принцип, на котором должно базироваться тестирование в образовании. Суть этого принципа состоит в том, что если нечто существует, то оно существует в определенном количестве. Обучение связано с изменениями в человеке; изменение заключается в различии между двумя ситуациями; каждая из этих ситуаций известна нам только по произведенному продукту – изготовленным вещам, произнесенным словам, выполненным действиям и т. п. Измерение любого из этих продуктов означает определение его количества таким образом, что в итоге мы будем знать его величину лучше, чем до измерения.
В течение 10 лет, предшествующих Первой мировой войне, а также какое-то время после нее Торндайк был своего рода оракулом образовательной психологии США, его взгляды на тесты и интеллект представлялись незыблемыми и не подлежали обсуждению.