E-LIT (Э-Лит) Читать Психодиагностика: учебник для вузов

Читать: Психодиагностика: учебник для вузов - Леонид Фокич Бурлачук на бесплатной онлайн библиотеке Э-Лит

Помоги проекту - поделись книгой:

1.3.7. Развитие психодиагностики в 1970-е гг

На протяжении 1970-х гг. психологическое тестирование продолжало подвергаться нападкам со стороны критиков, работающих как в этой области, так и вне ее. Основные направления критики были теми же, что и ранее: тесты обвиняли в том, что на их основе осуществлялась сегрегация детей, многих людей лишали возможности получения образования, в том числе профессионального. Отмечалось, что по многим тестам отсутствовали убедительные данные, касающиеся их валидности. Были высказаны предложения о полном отказе от проведения психологических тестов. При этом высказывалось мнение о том, что наблюдение за поведением человека в естественных условиях имеет более важное значение, чем тестирование. Менее ортодоксальные борцы с тестами предлагали создать новые тесты, которые были бы более валидны, нежели старые, и имели бы репрезентативные выборки стандартизации. Также предлагалось разрабатывать узкоспециализированные тесты с заранее определенными и ясными критериями валидизации.

Американская психологическая ассоциация (АПА) в 1975 г. подготовила специальный отчет для своих членов. В этом отчете были представлены данные о существовании определенных различий, обнаруженных при тестировании интеллекта у черных и белых. Средние результаты белых детей были выше примерно на одно стандартное отклонение, чем средние результаты черных подростков. Было выяснено, что эти различия постоянны на протяжении школьных лет, но они не могли служить основанием для сегрегации детей по расовому признаку и рассматриваться как доказательство генетических различий между этими расами. АПА предложила новое понимание интеллекта, согласно которому он прежде всего определяется через навыки, знания и установки на обучение. Соответственно тесты интеллекта должны содержать задания, репрезентирующие таким образом понятые его проявления. Был сделан вывод о настоятельной необходимости «лучшего и более справедливого использования тестов».

Отчет АПА повлек за собой немедленный ответ со стороны представителей того меньшинства психологов, которое выступало против тестов: «Психологическое тестирование исторически было квазинаучным инструментом для увековечивания расизма… оно выкопало выгребную яму… для ошибочных данных, которые усиливают эгоизм белых путем унижения черных людей и являются потенциальной угрозой геноцида черных» (статья Джексона, опубликована в журнале American Psichologist, 1975).

Несмотря на неутихающую борьбу с психологическими тестами, их количество продолжало расти. Совершенствуются известные тесты интеллекта, в 1974 г. была опубликована новая редакция шкалы Векслера для детей (WISC-R). Не остается без внимания психологов и знаменитый Стэнфорд-Бине тест. Во многом благодаря усилиям Роберта Торндайка появляется новая рестандартизация, выполненная на значительной выборке (1972). В дальнейшем эта работа будет продолжена, и очередная рестандартизация теста появится уже в 80-е гг. (Торндайк с коллегами, 1986).

Роберт Л. Торндайк

Родился в 1910 г. Сын известного американского психолога Эдварда Торндайка. Получил степени бакалавра по математике Веслианского университета (1931), магистра психологии (1932) и доктора философии (1935) Колумбийского университета. Ассистент профессора психологии в Университете имени Вашингтона (1934–1936), позднее – в Колумбийском университете (1936–1939), там же работал как ассоциированный профессор (1940–1948) и профессор (1948–1976). В годы Второй мировой войны – майор воздушных сил, занимался отбором пилотов. В 1953 г. был президентом Психометрического общества. Основные исследования посвящены тестированию способностей. Известен как создатель теста когнитивных способностей (совместно с Э. Хаген), а также группового школьного теста умственных способностей (совместно с И. Поржем, 1954). Умер в 1990 г.

Усилия ученых также были направлены на разработку новых критериев интеллекта, прежде всего тех, которые не были бы связаны с культурой. Объектом пристального внимания некоторых ученых становятся появившиеся несколько ранее так называемые «культурно свободные» тесты, но реализуемые в них попытки освободиться от культурно-социальных факторов оказываются в конечном счете тщетными. Один из авторов таких тестов – Раймонд Кеттелл – в 1971 г., основываясь на исследованиях своего ученика Дж. Хорна (1965), представляет на суд научной общественности новую теорию, в которой пытается решить пресловутый вопрос о соотношении природного и приобретенного в интеллекте. Развивая взгляды Спирмена, он полагает, что G-фактор складывается из двух общих факторов, которые были названы текучим и кристаллизованным интеллектом. По сути, текучий интеллект – то, что генетически детерминировано, а кристаллизованный зависит от социума и как раз является таким интеллектом, который измеряется традиционными тестами. Правда, он сообщает, что и кристаллизованный интеллект не просто вместилище всего того, что получено личностью в ходе ее развития, но также, только в меньшей мере, детерминирован генетически. Теория Хорна-Кеттелла не осталась незамеченной и не раз становилась предметом дискуссий не только в это десятилетие, но и позднее.

В работах известного английского психолога Ганса Айзенка продолжает проводиться мысль о том, что измеряемый тестами интеллект по меньшей мере на 80 % генетически детерминирован. Во многом итоговая работа этого ученого «Структура и измерение интеллекта» (The Structure and Measurement of Intelligenc, 1979) помимо новой модели интеллекта, во многом повторяющей гилфордовскую, доводит до читателя новые данные о «расщеплении IQ». Фактически эти данные не оставляют места для средовых воздействий на интеллект.

Огромное значение, и не только в США, для подведения хотя бы предварительного итога бесконечных дискуссий, посвященных измерению IQ, имела публикация книги Леона Дж. Кэмина «Наука и политика IQ» (The Science and Politics of IQ, 1974). Заслуга Кэмина состоит прежде всего в том, что он подверг тщательному анализу эмпирический материал, на котором базируется теория генетической предопределенности интеллекта. Оказалось, что известный английский психолог Сирил Барт, данные близнецовых исследований которого считались наиболее обширными и значимыми, эти данные попросту фальсифицировал. На основе своих изысканий Кэмин сообщает: «Мы видим, что данные Барта, говорящие о бесспорно самом сильном влиянии наследственности, несостоятельны из-за арифметических несообразностей и словесных противоречий. Несколько описаний того, как собирались данные, не совпадают друг с другом точно так же, как и описание применявшихся „тестов“. Оценки имеют субъективную окраску. Полное отсутствие информации о методических подробностях следует считать просто недопустимым. Никакая наука не может принять за основу подобные данные» (Kamin, 1974, р. 67).

Леон Дж. Кэмин

Родился в 1924 г. Бакалавр (1949) и доктор философии (1950) Гарвардского университета. Работал в качестве профессора в Мак-Джилл и Королевском университетах. Профессор и руководитель департамента Мак-Мастер университета Онтарио (Канада, 1957–1968). С 1968 г. профессор Принстонского университета. Одним из первых доказал, что многие из исследований Барта, якобы подтверждающие генетическую предопределенность интеллекта, фальсификация. Много пишет о вреде и опасности теорий генетической обусловленности IQ. Одна из основных книг на эту тему – «Природа Интеллекта. Битва за разум!», содержащая полемику с Г. Айзенком и написанная совместно с ним, – переведена на русский язык (2002).

Сирил Людовик Барт

Родился в 1883 г. в Лондоне. Степени бакалавра (1907), магистра (1909) и доктора (1923) получил в Оксфордском университете. На формирование взглядов Барта оказало влияние знакомство с Ф. Гальтоном. Профессиональная деятельность связана в основном с Лондонским университетом (профессор педагогики – 1924–1931 гг., профессор психологии университетского колледжа – 1931–1950 гг.). Исследования Барта по генетике интеллекта, первоначально высоко оцененные благодаря значительным выборкам испытуемых, оказались, как было доказано, попыткой выдать желаемое за действительное. В данном случае желаемым было доказательство того, что интеллектуальное развитие человека наследственно детерминировано. Выходит в отставку в 1951 г., скончался в 1971 г.

Так была разоблачена, вероятно, одна из самых крупных мистификаций в психологической науке. Теория генетической предопределенности интеллекта, согласно одному из центральных положений которой имеющиеся тесты измеряют природный интеллект, оказалась зданием, выстроенным без фундамента. Тем не менее это лишенное опоры и давшее трещины здание продолжают «ремонтировать» до сих пор.

Большинство новых инструментов измерения личности были опросниками, многие из которых могли бы быть приспособлены для компьютерной обработки. Хотя и в этой области психодиагностики, как и можно было ожидать, критические голоса были сродни тем, которые раздавались почти 50 лет тому назад: информация при самоотчетах искажается, люди могут быть в неведении относительно особенностей собственного поведения, вопросы могут не затрагивать важные аспекты личности.

Из личностных опросников, появившихся в 1970-е гг., стоит отметить Опросник общего здоровья Д. Голдберга (1972) и разработанный Т. Миллоном Клинический многоосевой опросник (1977). Опросник Голдберга был предназначен для диагностики психического благополучия, эмоциональной стабильности. Один из вариантов опросника (1978) быстро получил популярность как своего рода мерило «качества жизни» и был переведен на 28 языков.

Миллон создает опросник на основе собственной теории, согласно которой расстройства личности трактуются как прототипы. Каждый прототип содержит множество разновидностей. Таким образом получается, что, например, шизоидные или депрессивные типы не существуют обособленно, а являются различными формами выражения ядра или прототипа личности. Опросник в конце 1970-х– начале 1980-х гг. начинает активно внедряться к клиническую психодиагностику, чему способствует его соответствие принятым за рубежом классификаторам психических расстройств (DSM-III, а позднее – DSM-IV).

В психодиагностике, особенно клинической, по-прежнему продолжают пользоваться популярностью проективные методики, применение которых из-за часто недоказанной валидности вызывает дискуссии среди психологов. Некоторые клиницисты, такие как Хольт (Holt, 1971), продолжали утверждать, что результаты, полученные с помощью проективных техник, могут дать гораздо больше, нежели любая компьютерная распечатка, несмотря на то что они были получены эмпирическим путем.

Была предложена еще одна интерпретационная система для теста Роршаха (Ехпег, 1976). Ее характерной особенностью является психометрическая ориентация автора, стремящегося найти формулу для любого ответа испытуемого. К концу 1970-х гг. начинается активно проводимое Экснером внедрение этой системы в мировую роршахиану. Идет процесс постепенного вытеснения других схем интерпретации результатов по тесту Роршаха, о чем свидетельствуют соответствующие конгрессы и симпозиумы.

Характерной чертой развития психодиагностики в 1970-е гг. в развитых странах мира становится ее компьютеризация. Резко возрастает количество компьютерных версий тестов. Однако уже раздаются и первые призывы к тому, чтобы оценить последствия компьютеризации, изучить валидность и надежность тестов, предъявляемых и обрабатываемых с помощью компьютера. Возможности, предоставляемые компьютером, реализуются в так называемом адаптивном тестировании[16]. Адаптивное тестирование строится на основе разных процедурных моделей, но в конечном счете исследователь стремится из некоторого множества заданий предъявить испытуемому те, с которыми он может справиться.

В то же время в целом психологи уделяют тестированию все меньшую долю своего времени. В этом смысле показательны клинические психологи, которые всегда были активными потребителями разного диагностического инструментария. Так, если в 1959 г. в США около 44 % времени клинических психологов было уделено диагностированию с помощью тестов, то этот показатель снизился примерно до 24 % в 1976 г. Частично этот спад может объясняться возрастающей ролью психологов в психотерапии. Обучение психологическому тестированию стало занимать меньше места в аспирантских программах по психологии.

В 1974 г. в Монреале на Конгрессе Международной ассоциации прикладной психологии (International Association of Applied Psychology, IAAP) происходит важное для развития и координации психологических измерений событие – учреждена Международная тестовая комиссия (International Test Commission, ITC), в состав которой вошли представители 15 стран (в настоящее время входят национальные психологические общества 23 стран, а также все крупные издательства тестов). В этом же году увидел свет первый выпуск Бюллетеня ПС. Устав и основные организационные документы Комиссии были приняты позднее, в 1976 и 1978 гг.

В 1970-е гг. применительно к области измерения индивидуально-психологических различий наиболее употребительным становится термин, который к настоящему времени во многих странах Западной Европы и США почти полностью вытеснил ранее распространенный – психологическое тестирование. Это – психологическая оценка (см. об этом ниже).

В 1970 г. известный Институт психических измерений Буроса выпускает обширный справочно-обзорный том, посвященный личностным тестам (Personality Test and Reviews I), а четыре года спустя выходит в свет второй выпуск Tests in Print II. Оказался весьма урожайным на справочную литературу по тестам 1975 г. Пик начатой в 1970 г. Институтом Буроса деятельности по изданию тематических сводок тестов приходится на 1975 г. В этом году вышли многостраничные тома, посвященные тестам для измерения интеллекта, математическим личностным (второй выпуск) и др.

Заключая рассмотрение событий 1970-х гг., следует отметить и появление нового издания вышедших в 1966 г. «Стандартов для тестов». Изменилось их название. Они стали именоваться «Стандартами для образовательных и психологических тестов» (Standards for Educational and Psychological Tests, 1974). «Стандарты» становятся известными во многих странах мира, на их основе создаются национальные требования к психологическим тестам, их разработчикам и пользователям.

1.3.8. Развитие психодиагностики в 1980-е гг

В начале 1940-х гг. будущее психологического тестирования, во всяком случае в США, казалось отнюдь не светлым. Один из выпусков журнала American Psychologist (октябрь 1981) был полностью посвящен тестированию и грозящим ему опасностям, однако в дискуссиях наметилась и очевидная позитивная тенденция, суть которой сводилась к тому, что данное направление исследований не должно быть утрачено для науки и практики.

Количество тестов продолжало расти. Для диагностики личностных особенностей было разработано немало новых опросников, но исследователей по-прежнему беспокоила мысль о том, что ответы на вопросы могут быть сознательно или неосознанно фальсифицированы. Валидность оставалась наиболее уязвимым местом почти каждой диагностической методики, особенно проективной. Тем не менее годы критики относительно мало повлияли на статус проективных тестов. В первый десяток по популярности входили почти те же тесты, что и в прошлом десятилетии: MMPI, WAIS, гештальт-тест Бендер, тест Роршаха, WISC, тест на дополнение предложений, ТАТ, рисунок человека и некоторые другие. Данные о наиболее часто используемых в США тестах в период с 1935 по 1982 г. представлены на с. 79.

Большой интерес вызывало появление последней (четвертой) версии шкалы Стэнфорд-Бине (четвертой). Это были 15 субтестов с заданиями, расположенными в порядке возрастания трудности. Большое значение имело изменение отношения к тому, что измерял тест. Постепенно уходят в прошлое применительно к тестированию интеллекта термины «умственный возраст», «интеллект» и «IQ». Они были заменены понятиями «когнитивное развитие» и «стандартный возрастной балл». «Сырые» баллы, полученные в результате обследования, конвертировались в стандартный возрастной балл (СВБ).

Что дали эти изменения? Согласно некоторым критикам, они были попыткой преодолеть 20-летний спад в тестировании интеллекта (Spruill, 1987). Введение показателя СВБ в новую версию теста Стэнфорд-Бине принесло несомненный успех его разработчикам, правда, несколько омраченный тем, что в этом тесте стандартное отклонение было равно 16, в то время как большинство остальных шкал имело стандартное отклонение 15. Тем самым затруднялось сопоставление результатов, полученных с помощью разных тестов. Четвертая версия шкалы Стэнфорд-Бине была призвана погасить тот негативный эмоциональный заряд, носителем которого был /(^-показатель. В какой мере это удалось, сказать трудно, во всяком случае, понятие стандартного возрастного балла быстро нашло горячих сторонников среди тех, кому надоело обсуждать вопросы, связанные с наследуемым и приобретенным в интеллекте, отложив их решение до лучших времен.

Дальнейшее развитие получают векслеровские шкалы для измерения интеллекта. Незадолго до смерти его создателя выходит переработанный WAIS (WAIS-R, 1981). Новая версия Wechsler Preschool and Primary Scale of Intelligence (WPPSI-R) появилась в 1989 г. Эта шкала была повторно стандартизирована на 1700 детях от 3 лет до 7 лет и 3 месяцев, имела лучшие задания, были внесены другие изменения, но в основном это была та же самая шкала.

Свежей струей в тестировании интеллекта была появившаяся в это десятилетие батарея для измерения интеллекта детей, разработанная в Университете Алабамы Аланом Кауфманом. Оценочная батарея Кауфмана для детей (Kaufman Assessment Battery for Children, 1983) вобрала в себя последние достижения в области тестирования интеллекта. Автор отказывается от традиции, согласно которой детей относили к той или иной категории на основе коэффициента интеллекта. В оценочной батарее для характеристики умственного развития ребенка используются множественные показатели, а все когнитивные задачи рассматриваются автором в качестве критериев того, чему ребенок научился.

Несомненным достижением психологов 1980-х гг., достижением, имеющим непосредственное отношение к диагностике способностей, было издание в период с 1982 по 1989 г. пятитомника «Успехи в психологии человеческого интеллекта» (Advances in The Psychology of Human Intelligence). Этот труд был издан под редакцией известного американского психолога Роберта Стернберга, чья иерархическая модель интеллекта, разрабатывавшаяся в этот период, претендовала на объяснение взаимоотношений между интеллектом, с одной стороны, и познавательными процессами, опытом индивида, наконец, его поведением, с другой – (подробнее об этом далее). Несмотря на то что эта модель интеллекта носит откровенно когнитивистский характер, важно то, что ее автор критикует психофизиологическую редукцию интеллекта, свойственную, например, исследованиям Г. Айзенка. Еще одним свидетельством внимания психологов к проблеме интеллекта стало издание «Международного информационного бюллетеня по человеческому интеллекту» (Human Intelligence International Newsletter, 1980–1987), который освещал не только исследования в разных странах, но и приложение их результатов в области образования. Важным событием для понимания места и значения тестов в современном обществе становится выход в свет книги «Тестирование способностей: области применения, следствия и полемические вопросы» (Ability Testing: Uses, Consequences, and Controversies, 1982). В этом двухтомном труде рассматривались результаты использования тестов способностей в школах и высших учебных заведениях, при приеме на работу. Особое внимание было уделено этическим проблемам, возникающим в психологическом тестировании.

Роберт Стернберг

Родился 8 декабря 1949 г. в Ньюарке (Нью-Джерси) в учительской семье. Интерес к психологии, особенно тестам интеллекта, возник у него еще в детские годы из-за того, что во время обучения в школе он всегда имел низкие показатели по этим тестам и не мог согласиться с подобным обстоятельством. Окончил Йельский университет со степенью бакалавра (1972), степень доктора философии получил в Стэнфордском университете (1975). Профессор факультета психологии Йельского университета. Имеет многочисленные публикации по различным направлениям психологической науки, один из наиболее часто цитируемых современных исследователей. Избирался президентом Американской психологической ассоциации. Наибольшую известность получила его триархическая теория интеллекта.

В эти годы еще одна теория пополняет анналы психологии интеллекта. Ее создатель Ховард Гарднер стремится доказать, что интеллект – явление многокомпонентное, а эти компоненты (по крайней мере пять) функционируют самостоятельно и отличаются друг от друга (подробнее см. далее).

Пополняется арсенал личностных опросников. Достоянием психодиагностов в 1989 г. становится MMPI-2. Несмотря на свое сходство с MMPI, MMPI-2 – это новый диагностический инструмент. Такой вывод следует из множества новаций в MMPI-2. Достаточно сказать, что появилось 15 новых так называемых содержательных шкал, каждая из которых, за исключением трех, «сопровождается» разным количеством субшкал (всего 27 субшкал). Имелись и другие новшества. Опросник был стандартизирован на выборке с одинаковым представительством мужчин и женщин и пропорциональным представительством национальных меньшинств. Необходимость в появлении MMPI-2 обусловлена различными причинами. Прежде всего следует вспомнить о том, что с момента рождения MMPI прошло немало времени и требовалась по крайней мере очередная стандартизация. Разработчики стремились исключить двусмысленные или «обидные» утверждения, например такие: «Я думаю, что Линкольн был более знаменитым человеком, нежели Вашингтон». Также за прошедшие десятилетия подверглись изменениям смысл и значение некоторых утверждений, таких, в частности, как утверждение: «Я важная особа». Если в 1930-е гг. только 9 % нормальных взрослых людей соглашались с этим утверждением, то в конце XX в. ситуация резко изменилась. Примерно 49 % современных американских мужчин и женщин согласны с этим утверждением! В MMPI-2 был также осовременен язык около 14 % утверждений.

Ховард Гарднер

Родился 11 июля 1943 г. в Скрентоне (Пенсильвания) в семье немецких евреев, эмигрировавших в 1938 г. в США. Окончил Гарвардский университет со степенью бакалавра по специальности «Социальные отношения» (1965). Также обучался в Лондонской школе экономики (1965–1966), Гарвардской медицинской школе и Бостонском университетском центре по изучению афазий (1971–1972). Имеет степень доктора философии (1971). Трудовую деятельность начал в качестве учителя музыки (1958–1969). Работал в Бостонском госпитале психологом (1972), позднее – в Бостонской университетской школе медицины (1972–1975). В Гарвардском университете был руководителем продолжающегося и ныне проекта «Зеро» (1973). профессор этого университета (1986–1998). Профессор медицины (1979) и неврологии (1984) Бостонской университетской школы медицины. В настоящее время – профессор Гарвардской высшей школы образования (с 1998). Гарднер широко известен своими работами в области педагогической психологии, психологии искусства и творчества. Автор 23 книг, переведенных более чем на 20 языков мира. Создатель теории множественного интеллекта, представленной в книге «Структураума. Теория множественного интеллекта» (1983).

Восьмидесятые годы – годы значительного оживления в факторных исследованиях личности. На симпозиуме, посвященном факторным исследованиям личности (Гонолулу, 1980), в выступлениях Льювиса Гольдберга, Наоми Такемото, Андре Комрея и Джерси Виггинса обосновывалась пятифакторная модель личности, получившая название «Большой пятерки». Нельзя сказать, что ее авторы были полностью оригинальны в своих изысканиях (ср. с исследованиями, выполненными Терстоуном в 1930-х гг., и более поздними работами Р. Кеттелла), тем не менее модель вызвала значительный интерес. Пауль Коста и Роберт Макгри, ранее развивавшие трехфакторную модель личности (1976), добавляют к своим факторам нейротизма, экстраверсии и открытости опыту еще два: склонности к согласию и добросовестности. На основе этой модели ими создается первый опросник, предназначенный для диагностики «Большой пятерки» (1985).

Тем временем появляется множество компьютерных версий тестов, которые все чаще привлекают психологов. В течение 1983–1984 гг. результаты 300 тыс. тестовых исследований интерпретировались с помощью компьютера и высказывались предположения, что к 2000 г. практически все психологические тесты будут автоматизированы. Однако если в 1970-е гг. многие психологи оказались очарованы возможностями компьютеров и не особенно прислушивались к голосам, заявлявшим о проблемах, которые приносит с собой компьютеризированное тестирование, в это десятилетие предостережения звучат все чаще, носят более обоснованный характер и не остаются без внимания научной общественности. Указывается на необходимость продолжения исследований по определению валидности многих из автоматизированных тестов и полученных таким образом интерпретаций (Groth-Marnat и Shumaker, 1989). Компьютерные интерпретации, как оказалось, нуждаются в периодическом пересмотре. Также отмечается то, что должны быть решены вопросы, связанные с квалификацией, с одной стороны, разработчиков программного обеспечения, а с другой – психологов, проводящих компьютерное тестирование. Компьютерные интерпретации справедливо характеризуются как такие, которые грешат расплывчатыми утверждениями общего характера и тем самым применимы почти к каждому человеку.

В 1984 г. появляется еще одно справочное издание, посвященное тестам, – «Критика тестов» (Test Critiques), которое наряду с «Ежегодниками психических измерений» становится важным источником информации и критических оценок в отношении сотен тестов. Завершится эта десятитомная серия в 1994 г.

Переиздание Американской психологической ассоциацией в 1985 г. «Стандартов для образовательного и психологического тестирования» (Standards for Educational and Psychological Testing) явилось очередной вехой в совершенствовании нормативно-правовой основы диагностической деятельности.

В 1982 г. Любин, Ларсен и Матараццо опросили более 200 психологов, работавших в психиатрических больницах, общинных центрах психического здоровья, школах для умственно отсталых, психологических консультациях и больницах для ветеранов. Психологов просили расставить в порядке убывания наиболее часто используемые ими тесты. В 1988 г. Краг и Горовитц провели похожий опрос. Они предложили руководителям тренингов 38 различных учреждений (клиники психического здоровья, учреждения для умственно отсталых, психиатрические заведения и больницы для ветеранов) назвать применяемые ими тесты.

Как видно, оба списка очень похожи, и тесты, указанные в них, используются давно. Этот факт позволяет утверждать, что практика применения психологических тестов остается достаточно стабильной.

1.3.9. Развитие психодиагностики в 1990-е гг

Опубликованный в 1992 г. одиннадцатый выпуск Ежегодника психических измерений содержал сведения о 477 коммерческих тестах (тесты, которые в отличие от исследовательских изданы и предназначены для продажи специалистам)[17]. Наибольшая часть этих тестов предназначалась для диагностики личности (28,3 %), тогда как на исследование интеллекта были ориентированы всего 4,6 % от общего числа новых тестов (напомним, что каждый новый выпуск Ежегодника не повторяет ранее опубликованные тесты, за исключением случаев их переиздания или рестандартизации).

Среди тестов для диагностики интеллекта по-прежнему первые по популярности места занимают предназначенные для разных возрастных групп шкалы Векслера. Эти шкалы совершенствуются: так в 1991 г. выходит третья редакция шкалы для детей (WISC-R), а в 1998 г. – третья редакция шкалы для взрослых (WAIS-III).

Продолжают разработку новых тестов для измерения интеллекта А. Кауфман и Н. Кауфман. В 1990 г. был опубликован «Краткий тест интеллекта Кауфмана», состоящий из одного вербального и одного невербального субтестов и охватывающий возрастной диапазон от 4 до 90 лет. В 1993 г. этими исследователями предложен «Тест интеллекта подростков и взрослых Кауфмана». При разработке теста была предпринята попытка интегрировать теорию текучего и кристаллизованного интеллекта со взглядами других исследователей. Отличительной чертой теста является множество необычных и интересных заданий, привлекающих внимание обследуемых.

Следует упомянуть и о развитии в США «Британской шкалы способностей», о которой уже упоминалось ранее. Ее пересмотренная и расширенная версия под названием «Дифференциальные шкалы способностей» была издана Элиоттом в 1990 г. В этих шкалах автор избегает понятия интеллекта и предпочитает говорить о специфических способностях. Теоретическое обоснование шкал носит эклектический характер; используется однопараметрическая модель теории «задание-ответ», что позволяет градуировать каждое задание по уровню трудности (используется стратегия адаптивного тестирования). В целом шкалы благодаря множеству психометрических новшеств характеризуются высокой сложностью проведения и обработки результатов, что может препятствовать их распространению. Новые взгляды на измерение познавательной деятельности нашли свое отражение и в «Системе когнитивной оценки», разработанной Дж. Дасом и Наглиери (1997). Задания, входящие в тест, определяющий так называемый когнитивный статус, предназначены для измерения основных познавательных функций, участвующих в научении, но, как предполагается, не зависимых от школьного обучения. Тест создан в соответствии с авторской моделью интеллекта, полагающей планирование, внимание, симультанную и сукцессивную обработку информации его важнейшими составляющими.

Джон Б. Кэрролл

Родился 5 июня 1916 г. Получил степень бакалавра Веслианского (Wesleyan) университета (1937), позднее учился в Лингвистическом институте Мичиганского университета (1937). Степень доктора философии по общей психологии присуждена в Миннесотском университете (1941). Кэрролл был студентом Флоренс Гуденаф. Работал в университете штата Индиана (1942–1943). Чикагском (1943–1944) и других университетах США, Гарвардской высшей школе образования (1949–1967), позднее стал профессором психологии Университета Северной Каролины (1974–1982) там же руководил психометрической лабораторией имени Терстоуна(1974–1979). Почетный профессор этого университета с 1982 г. Внес значительный вклад в развитие лингвистики, обучение иностранным языкам и исследование индивидуальных различий в когнитивных способностях. Создатель трехуровневой (иерархической) модели интеллекта, в завершенной форме представленной им в книге «Когнитивные способности человека: обзор факторно-аналитических исследований» (1993).

Не остаются забытыми и тесты для оценки познавательной деятельности младенцев. Среди наиболее интересных и вызвавших внимание исследователей можно назвать Тест интеллекта младенцев Фэгена (Fagan Test of Infant Intelligence, 1992) и Оценку возрастного развития младенцев и детей раннего возраста (Infant-Toddler Developmental Assessment, 1995).

В области теории обращает на себя внимание концепция интеллекта, разрабатываемая американским психологом Джоном Кэрроллом. Она представляет собой еще один «иерархический взгляд» на структуру интеллекта (подробнее см. далее).

Интерес к проблеме интеллекта в том виде, как он измеряется тестами, оказался весьма устойчивым, и своеобразным итогом более чем двадцатилетних исследований в этой области была публикация «Энциклопедии человеческого интеллекта» (Encyclopedia of Human Intelligence, 1994). В то же время не прекращается воистину вечная дискуссия о врожденном (генетическом) и приобретенном в интеллекте. Выходит в свет книга американских психологов Ричарда Хернстайна и Чарльза Мюррея «Кривая „колокола“. Интеллект и классовая структура американского общества» (The bell curve: Intelligence and class structure in American life, 1994). Констатируя различия в IQ между разными этническими группами, населяющими США, авторы, полагая наследуемость интеллекта очень высокой, указывают на негативные общественные явления, связанные с появлением замкнутых элит и низших каст. Книга эта не только задела расовые чувства многих американцев, но и послужила, как пишет Анастази, еще большему укреплению разнообразных стереотипов и заблуждений, касающихся этнических и тендерных различий в выполнении тестов интеллекта, добавила путаницы и разногласий в этой сложной проблеме.

Процессы развития и использования личностных тестов не были столь дискуссионными в этот период. Незначительно сравнительно с прошлым десятилетием изменяется ситуация с популярностью личностных опросников. Анализ данных, содержащихся в PsyLit[18], за период с января 1990 по июль 1996 г. позволяет указать на следующие наиболее часто цитируемые опросники (табл. 1.1).

В 1992 г. публикуется вариант MMPI, предназначенный для обследования подростков – MMPI-А. Этот опросник, который начали разрабатывать в 1989 г., был стандартизирован на выборке, состоящей из 805 юношей и 815 девушек в возрасте от 14 до 18 лет. В опросник были включены новые шкалы: четыре шкалы валидности и шесть дополнительных шкал.

В 1990-е гг. в психодиагностике продолжается изучение роли ситуаций в поведении индивидуума. Естественно, что по большей части это относится не к обычным житейским ситуациям – основное внимание уделяется анализу поведения человека в сложных, стрессовых условиях. Разрабатываются и соответствующие диагностические инструменты. К изучаемым феноменам в первую очередь относятся посттравматические стрессовые расстройства, для измерения которых создаются многочисленные опросники. Все большее значение придается разработке инструментов, позволяющих оценить особенности реагирования на сложную ситуацию (защитные механизмы, совладающее поведение и др.).

Не теряют своего авторитета среди психологов и проективные тесты. Наряду с появлением новых идет развитие уже известных. Преобладающей схемой интерпретации результатов по тесту Роршаха становится та, которая развивается в работах Дж. Экснера. В 1993 г. Экснер публикует нормативные данные, опирающиеся на обследование 700 нормальных взрослых и 1390 детей в возрасте от 5 до 16 лет. Ирвинг Вейнер, известный специалист по тесту Роршаха, отмечает, что за последние два десятилетия эта популярная методика превратилась в стандартный и надежный с точки зрения психометрии инструмент оценки личности, применение которого позволяет сделать множество обоснованных выводов. Сказанное относится к разработкам Дж. Экснера, носящим, как уже отмечалось ранее, отчетливую психометрическую направленность. В то же время остаются и сторонники качественного анализа результатов по тесту Роршаха, хотя их становится все меньше и меньше. Проходят очередные международные конгрессы, посвященные тесту Роршаха и проективным методикам (XIV – в 1990-м, XV – в 1996-м, последний в это десятилетие XVI конгресс состоялся в 1999 г. в Амстердаме). Выходит в свет 23-й том пользующейся большой популярностью среди специалистов по проективным методикам «Роршахианы» (1999).

Сравнительный анализ популярности проективных тестов и личностных опросников показывает, что и за рамками клинической психологии проективная техника не утратила своего значения. Проведенный в США в 1990 г. опрос 64 руководителей консультационных психологических программ по вопросу использования тренинга личностной оценки при подготовке психологов-консультантов показал, что 45 % опрошенных используют в своих программах так называемую «объективную» личностную оценку, а 32 % – проективную. Для проведения «объективной» личностной оценки чаще всего используют MMPI, Калифорнийский психологический опросник и опросники Кеттелла. Для проективной личностной оценки применяют тест Роршаха, ТАТ и методики незаконченных предложений.

Начало 1990-х гг. отмечено значительным возрастанием числа тестов, использование которых предполагает наличие компьютера. Институт психических измерений Буроса сообщал о том, что количество таких тестов возрастает с 4 в 1965 г. до 400 – в 1990 г. В то же время в большинстве своем это компьютеризированные уже известные тесты, а не тесты, специально разработанные с учетом возможностей компьютера (компьютерные тесты). К концу 1990-х гг. можно констатировать определенный спад интереса к компьютеризированным тестам, и не только потому, что зачастую возникают проблемы с их надежностью и валидностью. Многие психологи, прежде всего работающие в клинике, не удовлетворены предлагаемыми программами интерпретации получаемых результатов, вполне обоснованно полагая, что данная работа – задача диагноста.

В 1990-е гг. Центр психических измерений Буроса[19] начинает очередной проект – публикацию реферативных настольных книг по отдельным направлениям тестирования. В 1994 г. выходит том, посвященный психологической оценке в школе. Своеобразным подведением итогов развития психодиагностики в 1990-е гг. стали публикации очередного, тринадцатого, выпуска «Ежегодника психических измерений» (1998), в котором сообщается о 370 новых тестах (в 1999 г. выходит приложение к этому Ежегоднику) и двухтомного Tests in Print (1999). Нельзя не упомянуть и уникальное 6-томное издание (1995), посвященное некоммерческим тестам (тесты, которые не вышли за рамки научных исследований и не предназначены для продажи другим пользователям), осуществленное Американской психологической ассоциацией (Directory of Unpublished Experimental Mental Measures).

Все возрастающая заинтересованность правительственных органов США в применении психологических тестов приводит в 1993 г. к образованию Совета по тестированию и оценке. Главная задача этого Совета состоит в разъяснении разнообразным правительственным службам значения психологических тестов как орудий государственной политики. Опубликованные Советом отчеты свидетельствуют о том, что наибольшее значение американское правительство придает тестированию в области образования, а также совершенствованию имеющихся тестов.

В 1999 г. вышло новое издание «Стандартов образовательного и психологического тестирования». В них появились существенные изменения в формулировании понятия валидности теста, что вызвало неоднозначную реакцию среди психологов[20].

Итак, «1990-е гг. свидетельствовали о неуклонном повышении и расширении интереса к психологическому тестированию. На это указывает как разработка новых тестов, часть которых отражает принципиально новые подходы, так и непрекращающиеся исследования существующих тестов наряду с систематическим пересмотром их более ранних версий»[21]. Добавим также, что по завершению этого десятилетия закончился более чем столетний период развития психодиагностики. За это время значительный прогресс был достигнут в разработке методик, с помощью которых пытались измерять едва ли не все возможные проявления индивидуальности. Психодиагностика прошла как через пики популярности и признания, так и по низинам яростной критики и даже забвения в отдельных странах мира. В новое тысячелетие эта наука, как и вся психология, вошла с множеством нерешенных проблем, но с обоснованной убежденностью в возможности их решения.

1.3.10. Развитие психодиагностики в первом десятилетии XXI в

Чем ближе та точка в истории психодиагностики, которая называется «сегодня», тем труднее говорить о событиях, происходящих в этой области психологического знания, выделить наиболее значительные из них. И в этом нет ничего удивительного. История – это, как хорошо известно, рассказ о прошедшем, узнанном. Когда же события, о которых нужно было бы писать, в силу их близости к настоящему времени автору не известны, а известные еще не получили должной оценки и понимания, что возможно только по истечению некоторого времени, складывается весьма своеобразная ситуация, подразумевающая возможность переосмысления этой истории. Эту возможность мы и оставляем за собой на будущее.

На самом рубеже XX и XXI вв. появляются три тома «Ежегодника психических измерений» (2001, 2003, 2005, 2007; соответственно 14, 15, 16 и 17 тома), что само по себе знаменательно, поскольку ранее эти издания не выходили столь часто и регулярно. Последний, 17-й, том дает информацию о 209 новых тестах.

Определенный прогресс заметен в области тестирования интеллекта. Прежде всего следует отметить появление новых редакций популярнейших шкал Векслера для детей и подростков (WISC–IV, 2003), а также детей дошкольного и младшего школьного возраста (WPPSI–III, 2002). Происходит развитие и не менее известной шкалы Стэнфорд-Бине. В новой, пятой, редакции (2003) этой шкалы значительно расширен возрастной диапазон (от 2 лет до 85 и старше); самое же главное в том, что данная версия позволяет обследовать лиц с высокими интеллектуальными показателями, а также оценить степень одаренности (gift).

Не остается вне изменений и «Оценочная батарея Кауфмана для детей» (Kaufman Assessment Battery for Children, К-ABC; 1983). В 2003 г. авторы существенно переработали тест, который называется теперь КАВС-П. Отныне он базируется на двух моделях интеллекта: первая – А. Р. Лурии, вторая – Кеттелла-Хорна-Кэрролла (так называемая СНС-модель); шкала достижений устранена, введены новые показатели. Изменился и возраст лиц, для которых используется тест (от 3 до 18 лет). Основные показатели могут быть получены как на основе модели Лурии, так и на основе СНС-модели, различается только время тестирования (25–55 мин для первой и 35–70 мин для второй).

Определенные успехи достигнуты также в области измерения социального и эмоционального интеллекта (см. гл. 4).

В России прошла первая с 1970-х гг. дискуссия о тестах интеллекта, которая была отражена на страницах журнала «Психология. Журнал Высшей школы экономики». Привлекшая наиболее известных российских и украинских специалистов в области психодиагностики, дискуссия показала, что существует значительный интерес к надежным и валидным психологическим тестам, в частности тестам интеллекта. В то же время следует признать и отсутствие достаточно развитой психодиагностической (тестовой) инфраструктуры как в России, так и на Украине. Тесты не могут успешно применяться, если нет их разработчиков, соответствующих исследовательских лабораторий, специализированных издательств, действующих, а не декларативных документов об этических принципах их использования, наконец, без сертификации и аттестации тех, кто с ними работает.

В первое десятилетие XXI в. стал значительно пополняться перечень личностных опросников. Упомянем лишь наиболее известные. К ним можно отнести Опросники Бека для молодежи (Beck Youth Inventories), созданные совместно с Дж. Бек (Beck, 2002) и предназначенные для измерения симптомов депрессии; анксиозных симптомов; симптомов необоснованной гневливости; симптомов нарушенного поведения; оценки Я-концепции. Каждый из 5 опросников состоит из 20 описаний мыслей, чувств и поведения, связанных с эмоциональными и социальными проблемами детей и подростков. Возрастной диапазон обследуемых – 7-14 лет.

Другой опросник – Кларка-Бека обсессивности-компульсивности (Clark-Beck Obsessive Compulsive Inventory, CDOCI) – создан совместно с Д. Кларком (2002) и предназначен для скрининга лиц с обсессивными и компульсивными симптомами. Он состоит из 25 утверждений, описывающих соответствующие симптомы. Возрастной диапазон обследуемых – 17 лет и старше. Представляют интерес и недавние разработки, осуществляемые под руководством американского психолога Миллона, – Миллона поведенческой медицины диагностика (Millon Behavioral Medicine Diagnostic, MBMD – M. Antoni, С Millon, S. Meagher, S. Grossman, 2003). Он предназначен для лиц в возрасте от 18 лет. В нем содержатся 165 вопросов, образующих 29 содержательных шкал, которые скомпонованы в 5 областей (например, стили копинга, психиатрические индикаторы, модераторы стресса), 6 показателей негативных для здоровья привычек (например, алкоголь, курение, наркотики) и 3 индикатора, характеризующие достоверность ответов. В 2005 г. опубликован Миллона доподростковый клинический опросник (Millon Pre-Adolescent

Clinical Inventory, M-PACI – Т. Millon, R. Tringone, С. Millon, S. Grossman, 2005), предназначенный для детей в возрасте от 9 до 12 лет. Он состоит из 97 вопросов и позволяет оценить семь личностных, столько же клинических показателей, а также содержит две шкалы, позволяющие установить достоверность ответов обследуемого.

Прошедшее в 2000–2001 гг. в США на страницах журнала «Psychological Science in the Public Interest» (имеющего значительно более широкий круг читателей, нежели специализированные издания) очередное обсуждение научного статуса проективных методик вновь продемонстрировало, что противостояние между противниками и сторонниками проективного подхода не только сохраняется, но и укрепляется. На этот раз предметом обсуждения были три основные, наиболее известные и часто используемые в клинике методик: тест Роршаха, тест тематической апперцепции (ТАТ) и рисунок фигуры человека. Валидность показателей этих методик была подвергнута (в который раз!) сомнению. Сторонники проективного подхода доказывали его обоснованность в решении ряда клинико-диагностических задач. В этой дискуссии отразились крайние точки зрения и нежелание искать компромисс между объективным и проективным подходами к диагностике личности (об этом подробнее см. в гл. 6).

В первые годы нового столетия прошли два международных конгресса по тесту Роршаха и другим проективным методикам (Рим, 2002; Барселона, 2005), увидели свет новые тома «Роршахианы». Основной темой 25 тома ежегодника (2002) были проблемы диагностики психической травмы, 26 (2004) – кросс-культурные исследования, а в 27 томе (2005) рассматривались вопросы взаимосвязи данных, получаемых с помощью методики Роршаха, с факторами «Большой пятерки».

Достаточно важным событием стала публикация книги «Позитивная психологическая оценка: руководство по моделям и измерениям» (2003). В ней американские, канадские, немецкие и английские психологи с разных сторон рассматривают проблему перехода от диагностики, выраженной в понятиях расстройств, нарушений, к диагностике, описываемой понятиями позитивных перспектив личности. В России вышли два учебника по психодиагностике, а в 2007 г. появилось новое, третье, издание «Словаря-справочника по психодиагностике», подготовленное издательством «Питер». В Москве прошли конференции «Психологическая диагностика и тестирование персонала» (2004, 2005), консолидирующие психологов-диагностов СНГ, работающих с персоналом различных государственных и негосударственных учреждений.

С целью выяснения популярности тестов повторенный в 2006 г. опрос российских психологов (о первом опросе см. на с. 103) вывел на первое место личностный опросник Кэттелла, второе место занял тест Люшера, а третье – MMPI, причем речь идет о его первоначальной редакции. При этом отмечается, что «…отечественные предприятия и организации предпочитают не покупать лицензий на западные тесты… даже самые популярные. А контрафактные продукты применяют почти все» («Психологическая газета», 18.08.2006). Сказанное может быть расценено только лишь как свидетельство сохраняющегося неблагополучия в практике тестирования.

Среди событий, имеющих значение для всех психодиагностов, необходимо упомянуть и о новом издании Американской психологической ассоциации – ее труде «Этические принципы психологов и кодекс поведения» (2002).

1.4. Тестирование в образовании

Сразу оговоримся, что к собственно психологическим тесты образовательные (или тесты достижений) не относятся, поскольку направлены прежде всего на оценку степени усвоения того или иного учебного материала. Тем не менее разработка психологических тестов во многом влияла и на развитие инструментов оценки знаний, эти исследования шли рука об руку, в них участвовали психологи, а поэтому в истории психодиагностики нельзя обойти вниманием тестирование в сфере образования, которая была и остается основным потребителем психологических тестов. А. Анастази справедливо замечает, что в тестах достижений основной интерес сосредоточен на том, что индивид может делать к настоящему времени. Эти тесты в отличие от тестов интеллекта и способностей в основном оцениваются в терминах валидности по содержанию.

Самые ранние сведения о проверке успеваемости в европейской школе датируются примерно 1200 г. В это время Университет Болоньи проводил первый устный экзамен на получение степени доктора философии. Это был единственный экзамен, который в то время сдавали студенты, и обычно продолжался он около недели. Интересно, что экзамен этот проходил в таверне, и студенты быстро установили традицию угощать едой и напитками как своих коллег, так и преподавателей. Естественно, что экзамен нередко переходил в пьяные ссоры и потасовки. Почти 500 лет такой устный экзамен оставался единственным видом «теста» на академическую успеваемость. В 1700 г. в Кембриджском университете устный экзамен был введен и для получения более низкой степени магистра. В начале XIX в. письменные экзамены становятся в Европе общепринятыми. В США первые письменные экзамены были введены в Массачусетсе в 1845 г.

Считается, что первопроходцем в области педагогического измерения был Реверенд Джордж Фишер, директор школы в Англии. Еще в начале 1860-х гг. этот педагог понял необходимость установления стандартов успеваемости в обучении. Для использования в своей школе Фишер разработал так называемые «книги шкал». Он присваивал значение единицы для выражения высшего показателя, которого возможно достичь, и значение пяти для обозначения наименьших достижений в таких предметах, как правописание, математика, навигация, библия, французский язык, общая история, рисование и др.

Американский врач и психолог Дж. М. Райе (1857–1934) заслуживает признания как первый из тех, кто начал массовое тестирование в школе. Он изобрел три различных теста на правописание, которые использовал для проверки примерно 33 тыс. учеников 4-8-х классов в 21 городе США. Отчет о результатах этого исследования был издан в 1897 г.

Этот отчет произвел фурор среди американских преподавателей. Одним из выводов исследования было то, что количество времени, проведенного в ежедневной тренировке по правописанию, не имеет непосредственной связи с успехами в нем (много позже по оригинальным данным Райса был рассчитан коэффициент корреляции, равный -0,12) Из этого следовало заключение о том, что детей нужно не столько учить правописанию, сколько развивать их ум. Впоследствии Райс направил свое внимание на поиск инструментов, позволяющих оценить уровень овладения арифметикой. В 1902 г. он составил серию арифметических тестов для 4-8-х классов и провел их примерно с 6 тыс. учащимися из 18 школ, расположенных в 7 городах. На следующий год был подготовлен языковой тест в форме презентации рассказа, по которому ученики должны были писать сочинение. Более чем 8 тыс. учащихся из 9 различных городов писали такие сочинения. Они были оценены Райсом по изобретенной им пятибалльной шкале, которой, как известно, предстояло большое будущее. Однако работы Райса, несмотря на их новаторский характер, не были достойно оценены его современниками. Отцом измерения в образовании в США был признан Э. Торндайк.

Проявляя интерес к статистике, Торндайк совместно с Фоксом в 1903 г. опубликовал исследование, в котором были разработаны и использованы несколько тестов, связанных с арифметическими операциями. Целью их исследования было изучение взаимоотношений между различными арифметическими операциями. В том же году Торндайк издает книгу под названием «Образовательная психология» (Educational Psychology). В ней описывались те виды тестов, которые считались наилучшими для определения успеха в обучении.

Публикация этой книги ознаменовала появление новой области – образовательной психологии, в которой нашлось место и проблемам измерения. Разработке этих проблем посвящена ставшая классической работа Торндайка «Введение в теорию умственных и социальных измерений» (Introduction to the Theory of Mental and Social Measurements, 1904). Помимо статистических методов в этой книге обсуждались принципы построения тестов.

В декабре 1909 г. Торндайк представил научной общественности свою широко известную Шкалу почерка. Эта шкала, по сути дела, была первым инструментом для измерения продукта образования. Торндайк собрал образцы почерков, которые классифицировались экспертами как различные по качеству. Для того чтобы образовать шкалу, он расположил эти образцы в порядке возрастания их качества. Шкала почерка Торндайка положила начало этапу стремительного развития тестов по многим образовательным предметам. Этому в немалой степени способствовал приток в США иммигрантов, обусловивший увеличение набора учащихся. Также возрастала необходимость в квалифицированных рабочих, что требовало их обучения и, конечно, развития инструментов для оценки его эффективности. К этому времени относится разработка арифметических тестов С. Стоуном, одним из последователей и учеников Торндайка. Широко известные как Стандартные тесты Стоуна, они внесли вклад в образовательное измерение и стали основой для исследований другого ученика Торндайка – С. А. Куртиса. Результатом усилий Куртиса стала Серия арифметических тестов А (1909). Позднее появляется значительно усовершенствованная серия В (1914).

При проверке бесплатных школ Нью-Йорка в 1910–1911 гг. впервые были использованы тесты для измерения успеваемости учеников как средство оценки эффективности школьной системы. Среди используемых в ходе этой проверки тестов (было обследовано более 30 тыс. учеников) были и тесты Куртиса. Они же были задействованы в последующих широкомасштабных исследованиях в Бостоне, Кливленде, других крупных городах США.

Среди других подготовленных Торндайком исследователей, внесших свой вклад в развитие образовательного измерения, был Б. Р. Букингем. В 1913 г. он разработал шкалу правописания, которая представляла новый тип измерительного инструмента. Уровни сложности 50 слов, отобранных для шкалы, были определены на основании процента правильных ответов учеников различных классов. После этого слова были расставлены в шкале в соответствии с их уровнем сложности. В шкалу вошли также 125 вспомогательных слов. Теоретической основой теста Букингема было положение о том, что способность к правописанию может быть измерена тем уровнем трудности, которого может достичь ученик по этой шкале. Принцип построения шкалы Букингема был использован Л. П. Айресом в его Шкале правописания, а также другими специалистами по образовательному измерению при создании тестов для разных предметных областей: С. Вуди – для тестов на математические операции; X. Г. Хотсом – для алгебры; В. А. С. Хен-моном и X. А. Брауном – для латыни; М. Р. Трабу – для языкознания, а также М. Дж. Ван-Вагененом – для тестов по истории.

Результаты тестовых исследований в крупных городах побуждают руководство школ к соответствующим нововведениям. В «Двенадцатом ежегоднике Национального общества по исследованию образования» (1913) впервые были даны официальные рекомендации по использованию тестов в школе. Руководство школ начинает активно использовать статистические методы. В университетах были разработаны специальные курсы для обучения статистическим методам будущих администраторов и технических специалистов в области образования. Основным учебником служило переработанное Торндайком «Введение в теорию умственных и социальных измерений» (1913).

Для содействия изучению работы школ независимыми организациями, городскими и окружными школьными департаментами, государственными отделами общественного обучения, а также университетскими центрами были созданы бюро образовательных исследований под руководством выдающихся специалистов в развитии измерения. Это обеспечило прогресс в области школьных измерений. Этими бюро предоставлялись услуги по обеспечению тестами персонала школ, проводилась стандартизация имеющихся тестов, создавались новые. Администрация и учителя школ знакомились с тестами и техникой их проведения. Продажа и использование тестов, по мнению Ашбо (1918), выросли до беспрецедентных размеров. Этот автор сообщал о том, что в 1916 г. было реализовано около 900 тыс. копий одного из популярных тестов, а ежегодная продажа некоторых других перевалила за 100 тыс. экземпляров. Использование тестов не ограничивалось пределами США. Они рассылались во многие страны мира. К 1918 г. В. С. Монро представил список 109 стандартизированных тестов на измерение успеваемости, которые уже были на рынке, включая 84 теста, созданных для младших классов (до 8-го класса включительно), а также 25 тестов – для старших классов. Большинство тестов для начальной школы составляли тесты на измерение успехов в математике и только один тест оценивал эффективность обучения рисованию. Тесты по иностранному языку лидировали среди тех, которые предназначались для старшеклассников.

Накануне Первой мировой войны тесты для измерения интеллекта были признаны как наиболее важные инструменты образовательной психологии. Интеллект стал особой областью исследования в образовательной психологии, и лидером этого направления также был Торндайк. В 1918 г. Торндайк формулирует принцип, на котором должно базироваться тестирование в образовании. Суть этого принципа состоит в том, что если нечто существует, то оно существует в определенном количестве. Обучение связано с изменениями в человеке; изменение заключается в различии между двумя ситуациями; каждая из этих ситуаций известна нам только по произведенному продукту – изготовленным вещам, произнесенным словам, выполненным действиям и т. п. Измерение любого из этих продуктов означает определение его количества таким образом, что в итоге мы будем знать его величину лучше, чем до измерения.

В течение 10 лет, предшествующих Первой мировой войне, а также какое-то время после нее Торндайк был своего рода оракулом образовательной психологии США, его взгляды на тесты и интеллект представлялись незыблемыми и не подлежали обсуждению.

Предыдущая глава

Следующая глава

Поделиться книгой:

Читать, слущать книги онлайн бесплатно!

Электронная Литература.

Бесплатная онлайн библиотека.