Продолжая использовать наш сайт, вы даете согласие на обработку файлов cookie, которые обеспечивают правильную работу сайта. Благодаря им мы улучшаем сайт!
Принять и закрыть

Читать, слущать книги онлайн бесплатно!

Электронная Литература.

Бесплатная онлайн библиотека.

Читать: Интеллект успеха - Роберт Стернберг на бесплатной онлайн библиотеке Э-Лит


Помоги проекту - поделись книгой:

4.-Связь слов. Здесь испытуемый должен сказать, что общего у первых трех слов из приведенного набо-ра и почему четвертое слово выпадает из этого ряда. Например, что общего у яблока, банана и апельсина, чего нет у чашки. Тест кажется чрезвычайно простым, но только для тех, кто вырос в среде, где все эти фрукты доступны и, соответственно, хорошо знакомы. Вы знаете, например, что такое гуава? А есть страны, в которых ответ на этот вопрос не вызовет затруднений даже у самых маленьких детей. Очень часто то, что преподносится в качестве тестов на вербальное мышление, оказывается проверкой знания словаря. Оба моих ребенка проходили предварительный тест проверки способностей к учебе, и оба получили одинаковые замечания. Для проверки вербального мышления детям предлагалось находить словесные аналогии, но проблема была не в том, что они не могли найти требуемые аналогии, а в том, что они не знали значения предлагаемых слов.

Таким образом, иногда тесты, предназначенные для оценки одних вещей (вербальное мышление), проверяют главным образом совсем другое (в данном случае знание словаря). Вот пример подобных упражнений, предлагаемых в рамках SAT-тестов: попробуйте указать аналогии – ИНТЕНСИФИЦИРОВАТЬ: УСИЛИВАТЬ: АКТИВИЗИРОВАТЬ: (а) увеличить; (б) уменьшить; (в) усиливать; (г) ослаблять; (д) мешать – если вы не знаете значения указанных слов.

К основным недостаткам подобных тестов относится то, что на основе интерпретации их результатов делаются ложные выводы. Так, в приведенном выше примере те, кто просто не знает значения редко используемых слов, могут получить ярлык людей с неразвитым вербальным мышлением. Думаю, было бы замечательно, если бы каждый знал, что и «интенсифицировать», и «активизировать» может означать «усиливать». Конечно, если вы решили стать учителем словесности, вам положено знать значение подобных слов. В то же время я подозреваю, что очень многие без проблем проживут всю жизнь и, возможно, добьются в ней немалых успехов, не отягощая себя знанием ни одного из этих слов.

5–6.-Анализ и копирование образцов. В тесте на анализ образцов испытуемый воспроизводит с помощью черно-белых двумерных фрагментов различные геометрические формы. Копирование подразумевает воспроизведение нарисованных геометрических фигур.

Эти два субтеста, возможно, отчетливее других демонстрируют ограниченность стандартной точки зрения на интеллект. Само слово «копирование» говорит о многом. Как правило, у испытуемых вознаграждается умение копировать работы других. Так о каком интеллекте идет речь? Это равносильно признанию вершиной творчества деятельность тех, кто день за днем проводит в музеях, копируя работы великих мастеров. В то же время кто возразит, что тесты типа Стэнфорд-Бине нацеливают на учебу, во главу угла которой ставится копирование и точное повторение слов учителя? Преуспеете в этом – будете круглым отличником. Если вы полениваетесь – возможно, потому, что вам претят столь бездумные подходы, – вашу интеллектуальность могут поставить под сомнение. Лично я считаю, что одно из преимуществ взрослых людей перед детьми состоит в том, что от нас, взрослых, уже не требуют закрашивать книжки-раскраски «правильными» цветами, ни в коем случае не выходя за очерченные границы. Если вы верите в подобные тесты, можете использовать эти книжки-раскраски в качестве совершенного мерила интеллекта.

7.-Матрицы. В данном субтесте испытуемому предлагается матрица, часть которой не заполнена, и он должен выбрать среди нескольких альтернатив правильный вариант заполнения. Матрицы уже давно используются для тестирования IQ. Но особое внимание уделяется так называемым «прогрессивным матрицам Равена» – чисто цифровым конструкциям, заслужившим славу наиболее объективного критерия оценки умственных способностей в целом. Их считают образцом справедливости по отношению к различным культурам, поскольку в них отсутствуют слова и, по мнению их приверженцев, они одинаковым образом воспринимаются представителями различных культур. Хотя о подлинном равноправии, конечно, не может быть и речи.

Итак, вы получили некоторое представление о возможных упражнениях, с которыми приходится сталкиваться при индивидуальном тестировании интеллекта. Остановимся теперь на проблемах подсчета и интерпретации результатов.

В методе Стэнфорд-Бине в выборке стандартизации – выборке, на основе которой устанавливается соответствие между количеством правильных ответов и значением IQ, – разность возрастов самых старших и самых младших ее представителей составляет двадцать два года – достаточно широкий диапазон. Данная выборка стандартизации используется в качестве контрольной группы для определения значимых результатов конкретного тестирования. Сколько, по вашему мнению, человек было протестировано для того, чтобы установить однозначную связь между количеством набранных очков (так называемый предварительный счет) и фактическим результатом тестирования (так называемым коэффициентом интеллектуальности, который позже мы обсудим подробнее)? В качестве отправной точки возьмем население Соединенных Штатов, составляющее примерно 250 миллионов человек. Должно быть, вы думаете, что выборка стандартизации включает 500 000 или хотя бы 50 000 человек? А как насчет 5000? Фактически она составляет 5013 человек – не так уж много, когда принятие решений, влияющих на дальнейшую жизнь испытуемых, зависит от точности интерпретации результатов. А если вспомнить, что выборке соответствует возрастной диапазон в двадцать два года, на каждый год возраста приходится менее 250 человек!

Диапазон в двадцать два года выглядит, с одной стороны, достаточно впечатляюще, но если вы посмотрите на проблему с другой точки зрения, он покажется весьма скромным. Он отражает тот факт, что данные тесты предназначены для проверки способностей к обучению. Выборка соответствует тем годам жизни, которые жители Соединенных Штатов проводят за школьными партами и в студенческих аудиториях. Но после двадцати двух лет (или около того) молодые люди покидают стены школы и начинают трудовую жизнь. Способности, которые позволяют добиваться успеха, уже другие, а тесты остаются прежними. Таким образом, система тестирования не только разработана, но и отнормирована с использованием выборки представителей населения со значительным возрастным смещением. Такая застывшая во времени реальность проявляется во всей своей ущербности, когда человеку солидного возраста приходится возвращаться за школьную парту и проходить тесты, отражающие положение вещей для юношей, а не для взрослых людей. Им приходится тратить время на изучение геометрии и прочих премудростей, которые они не использовали уже много лет и, скорее всего, никогда не будут использовать, кроме как при тестировании.

Хотя были предприняты определенные усилия для того, чтобы сделать эту выборку (с возрастным смещением) представительной по отношению к населению США, эти попытки закончились неудачей. Одна группа населения представлена в выборке с избытком – доля ее представителей в выборке выше соответствующей доли в общем населении страны. Что это за группа? Как раз та, которая почти всегда с избытком присутствует в различных психологических исследованиях, особенно в исследованиях интеллектуального развития. Речь идет о людях с более высоким социальным и экономическим статусом. Для компенсации этого недостатка выборки использовались методы статической коррекции. Но подобные корректировки носят заведомо приближенный характер, что опять-таки не добавляет уверенности в точности результатов тестирования.

Сравнения с другими тестами, включая прежние версии шкалы Стэнфорд-Бине, показали следующее: хотя отмечается примерное согласие результатов, количество очков как для одаренных людей, так и для умственно отсталых несколько ниже аналогичных результатов как для прежних версий данного теста, так и для его основного конкурента, теста Векслера. Учитывая, что минимальные результаты используются для вынесения диагноза «умственно отсталый», а максимальные результаты, соответственно, диагноза «интеллектуально одаренный», указанные систематические расхождения не способствует глубокому доверию к тестам, на основе которых выносятся жизненно важные решения.

Существуют и другие проблемы с этим видом тестов. Одна из них заключается в том, что для различного возраста предлагаются и различные субтесты (задачи), и не совсем понятно, как сравнивать результаты тестирования представителей отдельных возрастных групп. Более того, отличаются и допустимые диапазоны начисления очков для различных возрастов, а также для различных субтестов и наборов субтестов, что затрудняет сопоставление результатов не только по возрастам, но и при оценке отдельных способностей (например, когда необходимо определить слабые и сильные стороны испытуемого).

Вероятно, наиболее серьезной проблемой подобного тестирования является то, что статистический анализ (называемый «факторным анализом») структуры теста никак не связан со структурированием теста с целью получения частных результатов. Другими словами, нет соответствия этих результатов и методов выявления средствами статистического анализа действительных мыслей испытуемого. Таким образом, после проведение тестов у вас может оказаться набор результатов, которые никак не отражают процессы мышления тестируемого человека. Например, где конкретно может преуспеть человек с высокими показателями пространственного мышления?

Альтернативой методу Стэнфорд-Бине являются тесты Векслера – наиболее распространенная шкала тестирования интеллектуальности. Они основаны на тех же представлениях об интеллекте, что и шкала Стэнфорд-Бине. Система Векслера включает три уровня тестирования – «Тесты Векслера для проверки уровня интеллектуальности взрослых людей – исправленные» (WAIS-R), третье издание «Тестов Векслера для проверки уровня интеллектуальности детей» (WAIS-III) и «Тесты Векслера для проверки уровня интеллектуальности детей дошкольного и младшего школьного возраста» (WPSSI).

По результатам тестирования Векслера получают три показателя: вербальный, деятельный и общий. Вербальный показатель основан на таких тестах, как «словарь» и «подобие слов», при выполнении которых испытуемый должен указать, в чем состоит схожесть или связь пары объектов или понятий. Показатель деятельности основан на таких тестах, как «заполнение картинок», где нужно идентифицировать недостающую часть на рисунке объекта, или «упорядочение картинок», где нужно расположить перепутанные картинки (например, фрагменты из мультфильма) так, чтобы получилась связная история. При определении общего показателя комбинируются результаты вербального и деятельного тестирования.

Системе Векслера, как и тестам Стэнфорд-Бине, присущи проблемы, связанные с ее содержанием. Например, в тестах «подобие слов» преимущество отдается более категоричным ответам о схожести или несхожести объектов (например, оба объекта принадлежат к классу Х), чем, скажем, ответу, что объекты связаны функционально, то есть первый использует второй. Вывод о том, что первый ответ является в определенном смысле «лучше», чем второй, отражает не столько уровень мышления, сколько понимание процесса тестирования. Некоторые тестируемые способны находить нужные категоричные решения, но просто не знают, что именно они являются более предпочтительными при подсчете результатов. Аналогично, тест на заполнение картинок требует знания содержания этих картинок, а упражнение на упорядочение картинок окажется более простым для тех, кто уже привык к следующим в хронологическом порядке картинкам, например в виде мультфильмов или комиксов.

Как составляются тесты проверки умственных способностей

Каким принципам следуют авторы и издатели при создании подобных тестов? Существует два основных подхода к построению тестов, хотя один из них используется гораздо чаще другого.

Эмпирический подход

В данном подходе проводится серия наблюдений над людьми, которые преуспели в некоторой конкретной области, например в школе. После этого вопросы строятся так, чтобы отделить тех, у кого есть максимальные шансы добиться успеха, от тех, у кого эти шансы минимальны. Или даже еще проще: можно выбрать задания, с которыми дети постарше справятся с большей вероятностью, чем дети младшего возраста. Фактически именно таким образом поступал Бине – выбирал задания, позволявшие отделять старших детей от младших. Подобный подход выглядит достаточно разумным. В конце концов, с возрастом дети, как правило, умнеют. Однако с этим подходом связаны некоторые важные проблемы, приведшие в настоящее время к ряду дилемм, которые приходится решать при тестировании умственных способностей.

Одна из трудностей состоит в том, что выборки, на основе которых разрабатываются тесты, состоят фактически из одних детей. Вспомните, что тесты первоначально использовались и по-прежнему используются преимущественно для того, чтобы выделить очень одаренных детей среди их менее одаренных сверстников. В результате такие тесты, как правило, больше подходят детям, чем взрослым. Это и создает дилемму. Дети массу времени тратят на решение математических задач, тогда как взрослые могут по много лет вообще не заниматься подобными вещами. Когда зрелые люди пытаются поступить в колледж или аспирантуру, им предлагают выполнить стандартные тесты типа SAT или GRE, где нужно помнить теоремы из курсов алгебры и геометрии, а они, возможно, слышали о них в последний раз лет десять тому назад. Очевидно, эти тесты не могут служить таким же критерием оценки взрослых людей, каким они служат для учеников или недавних выпускников школ. Ничего удивительного в том, что люди старшего возраста часто при тестировании показывают слабые результаты.

Таким образом, структура и содержание тестов отражает в большей степени программу средней школы, чем те вещи, с которыми приходится сталкиваться зрелым людям в повседневной жизни. Эти тесты более уместно относить к критериям оценки «учебного интеллекта». Более того, школьная система, на которой они основаны, – это западная школьная система, которая принята вовсе не во всем мире. Даже в Соединенных Штатах ученики могут получать альтернативное образование; так, например, юные религиозные евреи ходят в синагогу, где основополагающие принципы черпаются из Талмуда, а не из классической западной литературы.

Вторая, связанная с первой, проблема обусловлена самим процессом тестирования. В младших классах дети еще не знакомы с процедурой тестирования. Лично я с большей настороженностью отношусь к результатам тестирования учеников до четвертого класса (то есть тех, кому еще не исполнилось девять-десять лет), поскольку маленьким детям часто в новинку сама обстановка тестирования. Я все еще помню свой первый тест в третьем классе с ответами на отдельных листочках. Это был «Тест проверки базовых способностей для штата Айова», который считался тестом достижений. У меня буквально стоит перед глазами то, как я подошел к последнему заданию и с ужасом обнаружил, что у меня осталось несколько незаполненных клеток для ответов. Я просто запутался и вносил ответы в позиции, которые соответствовали совсем другим вопросам. Но учительницу это не волновало. По результатам теста она сделала вывод о том, что уровень моих знаний в рамках тестируемого материала очень низок.

С годами ученики приобретают навыки выполнения тестов. Сама обстановка тестирования становится для них более привычной. Но дети, не посещавшие школы западного образца, могли никогда не сталкиваться с подобными заданиями. Точно так же люди среднего и старшего возраста, как на Западе, так и в других местах, могут годами не иметь ни малейшего представления о таких тестах. Для них процедура тестирования и даже мысль о ней могут быть сопряжены с переживаниями или страхом. И опять-таки, нельзя интерпретировать результаты их тестирования на основе тех же критериев, что и у молодежи.

Исследования показали, что немаловажное значение могут иметь и определенные особенности тестируемых. Например, чернокожие дети могут оказаться в менее выгодном положении при выполнении типичных тестов проверки умственных способностей. Могут сказаться и менее очевидные различия. Много лет назад, работая в летние месяцы в «Psychological Corporation», одном из крупнейших издательств тестов, которое находилось тогда в Нью-Йорке, я участвовал в приеме экзаменов. В компании решили, что для достижения максимально равноправных условий тестирования необходимо записать все задания на магнитофонную пленку. В таком случае каждый испытуемый будет слышать один и тот же голос, читающий инструкции с одинаковым для всех темпом и дикцией. В теории все выглядело замечательно. На практике все оказалось не так гладко.

Например, можно было ожидать, что для записи пригласят профессионального диктора с разборчивой, четкой артикуляцией и, возможно, с тем приятным «ванильным» акцентом уроженцев Среднего Запада, который легче всего воспринимается слушателями. Но по каким-то причинам президент компании решил начитать инструкции к тесту сам. Профессиональным диктором он не был. Что более существенно, его характерный техасский выговор основательно запутал, по всей видимости, немало ньюйоркцев. Его чтение было, возможно, по душе жителям Хьюстона, но многим жителям Нью-Йорка приходилось напрягаться, чтобы понять, о чем идет речь.

А что еще хуже, идея о том, что все будут одновременно выполнять инструкции, записанные на пленку, сыграла со многими злую шутку. Я наблюдал, как некоторые испытуемые терялись во время теста, у них буквально опускались руки – они еще не закончили одно задание, а механический голос из магнитофона уже диктовал следующее. Но когда сотрудники, в обязанности которых входило принятие решений о приеме испытуемых на работу, получали результаты тестирования, они видели аккуратные, чистые компьютерные распечатки, и создавалось впечатление, что так же четко и гладко проходил и сам тест.

В качестве последнего недостатка эмпирического подхода к построению тестов можно заметить, что авторы этих тестов, как правило, не задаются вопросом о том, что представляет собой интеллект. Они просто используют подтвержденные практикой критерии, например то, что позволяет отличить детей младшего возраста от детей постарше. Но дети с годами становятся в среднем выше и тяжелее. Авторы тестов не предлагают использовать для измерения интеллекта линейку или весы; рост и вес не являются критерием интеллекта. Но то, что на практике предлагается использовать для этих целей и в конечном итоге включается в тесты, вовсе не выглядит более обоснованным, чем измерение роста и веса. При отсутствии теории интеллекта нельзя дать четкого определения этого понятия, если, конечно, не удовлетвориться сомнительной формулировкой «интеллект – это то, что измеряется тестами»; данное рабочее определение предложил ныне покойный профессор Гарвардского университета с весьма уместной фамилией – Боринг (boring (англ.) – скучный, занудный).

Тесты, основанные на теории

Второй подход построения тестов состоит в создании теории интеллекта, на основе которой затем вырабатываются тесты. Преимущество такого подхода, очевидно, в том, что вы вооружены четким определением понятия интеллекта. Потребители тестов – психологи, школы или служащие, которые приобретают этот товар, – могут решать, нравится им данная теория или нет, и на основе этого решения покупать или не покупать тесты. Во многих отношениях такой подход к тестированию является более честным. Издатели тестов говорят, что они понимают под интеллектом, а потребители могут принять эту точку зрения или отвергнуть ее. Здесь нет лукавства с ярлыками: вам открыто говорят, что продают.

Но лишь очень немногие тесты проверки умственных способностей создаются на основе теорий интеллекта. Почему? Потому, что такой подход вынуждает издателей тестов принимать определенную концепцию интеллекта. А они, как правило, избегают этого: либо потому, что сами имеют весьма смутное представление об этом, либо для того, чтобы побольше продать своей продукции. Они рассуждают подобно производителям пищевых продуктов до принятия законов о точности содержания ярлыков и наклеек: чем меньше люди знают о том, что им предлагают, тем меньше вероятность, что они от этого откажутся. Сегодня, если вам не нравятся продукты с высоким содержанием жира, вы просто их не покупаете. Раньше, не зная содержания жира в конкретном продукте, вы вполне могли бы и купить его, повышая таким образом общий объем его продаж. Что касается тестов, то ввиду отсутствия четких теоретических основ вы часто покупаете то, о чем имеете достаточно смутное представление.

Как оцениваются тесты проверки умственных способностей

Безусловно, потребители тестов не являются полными идиотами и хотят получить адекватную информацию об этом товаре – их приходится убеждать, что тесты небесполезны хотя бы в некоторых процессах принятия решений (или, по крайней мере, производят такое впечатление).

Валидность

Первую важную информацию такого рода, которая будет постоянно обсуждаться в данной книге, часто называют «критерием валидности». Вопрос здесь состоит в том, насколько результаты тестирования измеряют то, что они должны измерять в соответствии со своим назначением. Отражают ли они то, что от них действительно ожидают? Например, критерием валидности тестов проверки умственных способностей часто служат оценки, которые ученики получают в школе; а если речь идет о программах профессиональной подготовки, критерием может быть последующая эффективность на рабочих местах.

В так называемых технических руководствах по использованию тестов приводится масса статистических материалов, связанных с критериями валидности тестов. Но здесь, опять-таки, не все так просто. В какой степени нас должны беспокоить оценки в школе? Разве они служат показателем того, что один человек умнее другого? Или должны ли нас волновать показатели стандартизованных тестов достижений? Мой сын начал выпускать свою газету в школе, он постоянно готовит материалы в уже существующую школьную газету, пилотирует самолет, переводит в местной больнице на английский язык жалобы и другие медицинские проблемы испаноязычных пациентов. По-моему, неплохие достижения для семнадцатилетнего парня. Однако ни одно из них не относится к тем критериям, по которым проверяется валидность тестов проверки интеллектуальности. А разве взрослых людей волнуют полученные когда-то оценки? Может быть, кандидатов на ответственные посты в промышленности отбирают на основе этих оценок? Сомневаюсь!

С моей точки зрения, очень печально, что мы относимся к результатам тестирования способностей как к официальным, важным данным, а к внеклассной деятельности детей – как к чему-то второстепенному. И поскольку часто бывает удобно прикрываться количественными результатами, мы предпочитаем просто считать, а не серьезно анализировать такую деятельность. В результате ученик, посещающий три внешкольных клуба, оценивается выше того, кто придумал и организовал один клуб. Наилучшим предсказателем интеллекта успеха в будущем является интеллект успеха в прошлом. И предсказания должны базироваться на успешной деятельности в реальном мире в течение длительного периода времени, а не на успехах в мире тестирования, длительность существования которого составляет всего три часа.

Уже не один год я заявляю: тесты не измеряют то, что действительно важно для подлинного успеха и в учебе, и на работе. В частности, я утверждаю, что на уровне аспирантуры, где готовятся профессионалы, тесты не измеряют навыки и способности, которые важны для получения работы. В конце концов, я решил подтвердить свои слова объективными фактами. Вместе с Венди Вильямсом мы исследовали значимость предсказаний приемного письменного экзамена (GRE). В выборку были включены абитуриенты за двенадцатилетний период (166 студентов), обучавшиеся в рамках нашей программы по психологии для аспирантов. Результаты прогнозов GRE сравнивались с оценками, полученными в первый и второй год аспирантуры, а также, что более важно, с оценкой студентов преподавателями с точки зрения (а) аналитических способностей, (б) творческих способностей, (в) практических способностей, (г) исследовательских способностей, (д) способностей к преподаванию, (е) подготовленных диссертаций. Безусловно, в аспирантуре последний показатель имеет гораздо большее значение, чем полученные оценки.

Ну и какими оказались результаты? Рассматривая совместно мужчин и женщин (последние на равных основаниях участвовали и в тестах, и в самой программе), мы обнаружили, что GRE устойчиво прогнозирует оценки, получаемые в течение первого года программы, но не более. Хотя уровень оправданности предсказаний и здесь был более чем скромен. Для GRE-тестов на вербальное мышление общая корреляция составляла 0,18 (0 – отсутствие корреляции, 1– полная корреляция) – результат на грани статистической значимости. Для аналитических способностей корреляция была равна 0,17 – опять-таки на пределе статистической значимости. Максимальная корреляция, что не удивительно, была получена для теста достижений в психологии – 0,37. Достижения в тесте явились наилучшим предсказанием достижений в программе. Какие-либо другие важные критерии тест не прогнозировал. Он не предсказывал даже оценки на втором году обучения. Стало понятно, почему издатели теста, приводя информацию о валидности теста, уделяли такое внимание оценкам в течение первого года обучения!

Интересные особенности были обнаружены после того, как мы провели классификацию по половому признаку. Один из субтестов – аналитический – с умеренной точностью, но статистически значимо прогнозировал некоторые из наиболее важных критериев, но только для мужчин. Например, для мужчин корреляция показателей аналитического GRE-теста с оценкой преподавателями аналитических способностей аспирантов составляла 0,31. Для женщин эта корреляция была равна всего 0,05. Фактически, для женщин тест вообще не давал статистически значимых предсказаний. Таким образом, комбинация результатов для мужчин и женщин дает обманчивую картину эффективности теста в прогнозировании успеха в аспирантуре. Хотя достижения мужчин и женщин в рамках нашей программы в общем равнозначны, предвестники их успехов существенно различаются. Причины этих расхождений пока неизвестны.

Мы полагаем, что на основании проведенных исследований можно сделать несколько полезных выводов. Во-первых, тесты предсказывают прежде всего оценки, и часто именно оценки оказываются их единственным удачным прогнозом. Нет ничего плохого в предсказании оценок – они также важны, тем более что мы постоянно себя в этом убеждаем, – но жизнь вовсе не сводится к одним только оценкам. Во-вторых, точность прогноза не одинакова для различных групп, о чем нельзя забывать, анализируя результаты тестирования. Женщинам приходится решать ряд проблем, которые неведомы мужчинам. Кроме того, как показывают исследования, женщины часто убеждены, что не способны выполнять определенные задачи, в результате чего они действительно очень слабо справляются с этими задачами. Когда человек настраивается на неудачу, вероятность неудачного исхода заметно возрастает.

Мы не были особо поражены результатами наших исследований GRE-тестирования, равно как не были удивлены и реакцией на них в различных группах, где мы показывали эти результаты. Те, кто с самого начала скептически относился к тестам, кивали головой – дескать, ничего другого мы и не ожидали. Но горячие приверженцы тестирования со скепсисом отнеслись как раз к нашим изысканиям. Они, например, заявили, что для подлинной проверки теста необходима информация о том, насколько преуспели бы в программе те, кто не был принят.

В определенном смысле они правы. Было бы замечательно узнать, как бы пошли дела у тех, кто не был принят. Лично я считаю, что у большинства из них все было бы в порядке. Но проблема в том, что мы не можем провести подобные исследования – именно потому, что такие люди не были допущены к участию в программе, причем чаще всего на основании результатов тестирования. То есть чтобы разубедить скептиков, необходимо провести исследования, которые провести невозможно. Но зато можно сделать что-то довольно близкое к этому. В течение года или нескольких лет мы могли бы принимать всех абитуриентов, независимо от результатов тестирования, и посмотреть, как они проявят себя в различных аспектах программы. В этом случае базовая выборка была бы свободна от того смещения, которое «портит» выборку, сформированную по результатам тестирования. Идеальным с точки зрения эксперимента был бы, безусловно, случайный прием абитуриентов. Но, конечно же, никто не захочет закрывать глаза на результаты тестирования в течение года или двух, а руководство факультета будет против набора аспирантов по случайному принципу. Таким образом, система остается на прежнем месте, а люди – при своих убеждениях, которые, похоже, так никогда и не удастся переломить.

Наши исследования GRE-тестов и другие подобные данные указывают на необходимость получения дополнительной информации о валидности тестов – помимо той, что обычно приводится в технических руководствах. Нужны более универсальные критерии, а также данные о валидности тестов для различных групп людей и различных ситуаций. Часто подразумевается, что, раз тесты работают для одной группы, они будут работать и для других, хотя на практике можно наблюдать обратное.

Надежность (достоверность)

При оценке тестов их издатели и потребители уделяют пристальное внимание еще одной характеристике. Речь идет о надежности (достоверности), которая определяет, насколько устойчиво тест измеряет то, для чего он предназначен. Другими словами, если тест выполняется один раз, а затем еще раз, будут ли совпадать результаты?

Многие из распространенных тестов достаточно надежны – в противном случае они бы и не завоевали такую популярность. Но здесь речь идет об усредненных показателях. Встречаются люди, результаты которых флуктуируют в умеренных пределах, а есть и такие, у которых разбежки от теста к тесту могут быть значительными. Так, например, с помощью специальных пособий и курсов подготовки многим удается улучшать результаты выполнения таких тестов, как SAT и GRE, или других аналогичных конкурсных тестов.

В связи с доступностью таких книг и курсов, а также с учетом того, что они позволяют в среднем заметно повышать показатели тестирования, возникает вопрос о равноправии. Как быть с теми, кто не знает о существовании таких курсов, кто не может себе их позволить или у кого нет на них времени? Безусловно, издатели тестов будут настаивать, что даваемые книгами и курсами преимущества не так уж велики. В среднем, конечно, нет. Но для отдельных людей они существенны, а что более важно, когда речь идет о миллионах решений, принимаемых в течение года по результатам миллионов тестов, даже очень маленькие различия приведут в среднем к весьма впечатляющим последствиям. Для некоторых соответствующая книга или курсы могут сыграть важную роль, и ввиду неравноправного доступа к ним результаты тестирования для различных людей не могут интерпретироваться единым образом. Поэтому общая надежность тестов призвана нивелировать подобные нежелательные последствия неравноправия.

Издатели также отдают предпочтение таким тестам, в которых отдельные задания конкретного субтеста измеряют примерно одну и ту же характеристику. Они даже приводят статистические данные, демонстрирующие однородность различных элементов субтеста по отношению к измеряемой характеристике. Хотя за такую согласованность результатов приходится расплачиваться. Чем больше элементов теста измеряют одно и то же, тем меньше диапазон проводимых измерений. Другими словами, согласованность достигается за счет широты охвата. Узость используемых тестов, похоже, мало кого волнует; но тесты ведь действительно очень ограничены! Мы имеем надежные хорошие измерения пассивного интеллекта. Но как использовать результаты этих измерений?

Как используются тесты

Тесты используются так же, как это описывает принцип Гейзенберга: прибор, проводящий измерения, сам влияет на оцениваемые характеристики. Например, в нашем обществе те, кто находится на верхних ступеньках социальной лестницы, – юристы, врачи, бизнесмены, профессоры колледжей – имеют, как правило, более высокие IQ, чем те, кто занимает нижние ступеньки этой лестницы, – поденщики, уборщики, дворники. Таким образом, IQ связан с занимаемым положением, но является ли он причиной достижения этого положения?

Здесь важно уметь отличать причинно-следственную связь от простой корреляции. Известно, например, что большинство населения Нигерии имеет черный цвет кожи, а большинство жителей Норвегии – белый. Однако вы же не сделаете вывод о том, что проживание в Нигерии делает кожу человека черной, а жизнь в Норвегии, соответственно, белой. Вот вам пример, что корреляция не всегда является причиной. При установлении корреляции следует иметь в виду, что имеются по крайней мере три возможные ее причины. Предположим, имеется корреляция между двумя вещами, например измеренным интеллектом и занимаемым служебным положением. Из соображений общности назовем их «фактор Х» и «фактор У». Возможно, фактор Х вызывает фактор У; возможно, фактор У вызывает фактор Х; но не исключено, что существует фактор более высокого порядка, который является причиной для них обоих.

Таким образом, корреляция между IQ и занимаемым рабочим местом может быть связана с тремя различными механизмами. Именно благодаря высокому IQ человек может получить более престижную работу – это вполне вероятно. Или более хорошее рабочее место может способствовать повышению IQ, что, в свою очередь, также справедливо. Хорошая работа позволяет тренировать интеллектуальные способности, что в результате ведет к совершенствованию интеллекта и повышению IQ. Но может быть и высокий IQ, и хорошая работа обусловлены некоторыми другими факторами. Но что это тогда за факторы?

Рассмотрим ситуацию в Соединенных Штатах. Для того чтобы поступить на юридический факультет, необходимо пройти юридическое тестирование (LSAT); чтобы поступить на факультет бизнеса, необходимо пройти соответствующее бизнес-тестирование (GMAT); чтобы поступить на медицинский факультет, необходимо пройти тестирование на знание медицины (MCAT); чтобы поступить в аспирантуру, необходимо выполнить соответствующие тесты для аспирантов (GRE или MAT). Для поступления в аспирантуру на специальности с высоким конкурсом необходимо набрать определенный результат на вступительном тестировании. Аналогичная процедура приема практикуется в престижных колледжах и частных школах.

Так какова же связь между приведенными фактами и корреляцией между IQ и занимаемым рабочим местом? Обычные тесты оценки интеллектуальности связаны со всеми этими тестами на приемных экзаменах, равно как последние взаимосвязаны друг с другом – несмотря на различные названия все они измеряют практически одни и те же способности. Использование незначительных вариаций названий и содержания тестов может оказаться прибыльным бизнесом, но все эти манипуляции слабо сказываются на конечных результатах. Те, кто хорошо справляется с одним из тестов, как правило, не имеет проблем и с остальными.

Предположим, что кто-то по тем или иным причинам испытывает трудности с тестированием. Возможно, этот человек обладает выдающими творческими способностями, но у него проблемы с аналитическим мышлением. Возможно, речь идет о человеке с незаурядной практической сметкой и замечательным здравым смыслом, который в то же время достаточно беспомощен на абстрактном, академическом уровне. Возможна и боязнь тестирования – подобное в свое время было со мной. Или, скажем, человек вырос в семье, где говорили по-испански, по-французски или по-вьетнамски, и его английский язык оставляет желать лучшего. А может быть, английский его родной язык, но, поскольку родители этого человека были вынуждены оба работать, ему в детстве мало читали и редко с ним разговаривали, что сказалось на вербальном интеллекте. Можно назвать множество причин, в связи с которыми у людей могут быть проблемы с тестированием.

Если такой человек захочет пройти по конкурсу в аспирантуру (что дает своего рода пропуск на престижное рабочее место), можно сказать, что ему не повезло, поскольку практически все учебные заведения в рамках выбранной им специальности требуют прохождения практически одного и того же теста. Решив получить образование, такой человек рискует постоянно оказываться перед запертой дверью. В конечном итоге он имеет все шансы опуститься на нижние ступеньки профессиональной лестницы. Сравним теперь таких людей с теми, кто без проблем справляется с тестами. Возможно, у последних и не так уж много талантов, но среди них есть умение набирать при тестировании большое количество очков, которые позволяют получать образование по выбранной ими специальности. Возможно, им окажутся не по силам наиболее сложные программы обучения, но шансы получить приемлемое образование у них все-таки выше. А это образование позволит, в свою очередь, приобрести и более престижную профессию.

Поэтому не приходится удивляться, что люди на верхних ступеньках профессиональной лестницы имеют высокие результаты тестирования. Без таких результатов они бы просто не смогли там оказаться. Фактически мы сами создаем корреляцию между IQ и профессиональным статусом!

Очень важно иметь в виду, что так было не всегда и не везде в мире общество организовано подобным образом. Если вы вернетесь в пятидесятые годы, то обнаружите, что в среднем результаты SAT были гораздо ниже, чем через десять лет. Что же произошло? Неужели люди вдруг стали настолько умнее? Конечно же нет. Просто во многих колледжах изменили критерии набора студентов, уделяя больше внимания результатам тестирования и меньше – социальным аспектам. С определенной точки зрения выдвижение на первый план показателей тестирования повышает шансы более способных абитуриентов. В других странах на возможность получения высшего образования помимо способностей влияют и другие факторы, в том числе социальное происхождение.

Рассмотрим интересную аналогию. Предположим, что в нашем обществе принимается решение больше не обращать внимания на результаты тестирования, поскольку даже у одних и тех же людей эти результаты весьма изменчивы. Один раз, выполняя SAT, вы можете набрать 500 очков, а при повторном тестировании на следующий день набираете, например, 570 очков. Поэтому решают заменить результаты тестирования более устойчивой характеристикой – ростом человека. С определенного момента прием в колледжи и аспирантуру будет осуществляться на основе роста абитуриента. Для поступления в Гарвард рост должен быть, скажем, шесть футов и четыре дюйма. Для Йельского университета достаточно шести футов и трех дюймов (плюс привлекательный внешний вид). И так далее, пока не дойдем до наименее престижных заведений, где «проходной рост» составит четыре фута и три дюйма. Безусловно, для поступления на престижный медицинский или юридический факультет нужно быть еще выше, скажем шесть футов и семь дюймов. Моя аналогия может показаться вам глупой, но на самом деле это не так. В реальной жизни люди, занимающие верхние ступеньки социальной и профессиональной лестницы, в среднем выше тех, кто оказывается внизу. Рост учитывается, только мы себе в этом не признаемся.

Продолжим нашу аналогию. Через двадцать пять лет после введения в качестве основного критерия приема роста вы решаете сопоставить средние IQ людей с различным статусом – юристов, врачей и управленцев, со одной стороны, с поденщиками, дворниками и рабочими на конвейерах, с другой стороны. Что же вы обнаружите? Окажется, что чем выше занимаемая человеком ступенька на социальной и профессиональной лестнице, тем больше его рост. Это свидетельствует о том, что более высокий рост способствует более успешному выполнению профессиональных обязанностей? Нет! Это отражает то, что рост человека использовался в качестве критерия при принятии решения о том, какую работу ему будет позволено – или не позволено – выполнять.

Я не утверждаю, что IQ совсем не связан с профессиональными успехами. Связан, хотя и слабо. Просто ни в коем случае нельзя делать вывод, как сделали Хернштейн и Мюррей в своей книге «Кривая Белла», о существовании некой таинственной руки – некой силы природы, – которая подымает наверх сливки общества, а его отбросы опускает вниз. Скорее, мы должны признать, что имеем то общество, которое создаем своими руками. Не природа решает, кого из нас выделять, – решает общество.

Конечно, коэффициент умственного развития кое-что значит, но не так уж и много. Связанные с IQ характеристики, как правило, объясняют менее 10 процентов расхождений между теми, кто преуспел в жизни, и теми, кто оказался менее удачен. Это означает, что природа 90 процентов вариаций остается непонятной, по крайней мере с точки зрения IQ. По-моему, нет особых оснований утверждать, что IQ играет важную роль. А как обстоит дело с различиями между группами?

Групповые отличия по IQ и умственным способностям

Существуют факты, которые трудно оспорить. Например, в Соединенных Штатах различные расовые и этнические группы имеют различные IQ. Сам по себе факт подобных вариаций не является свидетельством наличия смещения в тестах. Смещение не есть функция расхождения результатов тестирования в различных группах. О смещении можно говорить только в том случае, когда тесты, предназначенные для прогнозирования определенной характеристики, не дают одинаковых различий.

Накопленные данные о смещении (то есть необъек-тивности) тестов изучены подробно и дотошно. Главный вывод проведенных исследований – тесты не смещены, по крайней мере в традиционном для статистики смысле. Давайте все-таки подумаем о сути этого вывода.

Имеется в виду следующее: если группа А показывает при тестировании интеллекта худшие результаты по сравнению с группой В, то, как правило, она также будет слабее проявлять себя и при реализации тех характеристик, для прогнозирования которых предназначен используемый тест. Таким образом, если груп-па А хуже справляется с традиционным тестом оценки интеллекта, чем группа В, то у группы А с большей вероятностью будут, например, более низкие оценки в школе. Так, в среднем в Соединенных Штатах у представителей негритянского населения показатели тестирования примерно на одно стандартное отклонение (15 очков IQ) ниже, чем у представителей белой расы. Первые также слабее успевают в школе. Ага! Артур Дженсен, Ричард Хернштейн, Чарльз Мюррей и другие представители «правого крыла» в теории интеллекта утверждают, что смещение отсутствует. Американцы азиатского происхождения при прохождении многих тестов показывают результаты несколько выше, чем их белые сограждане, и точно так же они имеют более высокие показатели в школе. Значит, смещения действительно нет? Но погодите минутку.

Являются ли отклонения для различных расовых групп врожденными, или, другими словами, наследуемыми? Хернштейн и Мюррей утверждают, что да[10]. Но факты не подтверждают их выводов. Хернштейн и Мюррей, наряду с другими исследователями, указывают, что наследуемый характер различий между группами связан с наследуемой природой интеллекта. Но фактически все доступные данные позволяют проводить лишь внутригрупповые оценки наследуемости. Эти данные говорят о механизмах передачи интеллекта в пределах одних и тех же групп, а не между группами. Таким образом, исследования, проведенные преимущественно для белых близнецов, могут рассказать о причинах различий индивидуумов, относящихся к белым близнецам, но никак не объяснят расхождений между группами, одни из которых состоят из представителей белой расы, а другие – из представителей черной.

Выявляемые различия нельзя признать статистически безупречными. Приведем один популярный пример, который также используют Хернштейн и Мюррей. Предположим, у вас есть семена кукурузы в достаточном количестве, чтобы были представлены все нормальные вариации данной культуры. Половина семян высевается на полях Айовы, а вторая половина – на скудных землях Моджавской пустыни. Хотя качества сортов кукурузы являются в высокой степени наследуемыми, в данном случае различия в развитии двух посевов определяются исключительно внешними условиями. Каким образом все это связано с различиями белых и черных групп?

Даже если интеллект является в определенной степени наследуемым, подобная наследуемость, которая определяется внутри групп, не объясняет причины различий между группами. На это указывает и пример с кукурузой. Более того, сравнивая группы, необходимо иметь четкое представление о том, что сопоставляется. Так, например, в Соединенных Штатах утверждение о чистоте рас является откровенной глупостью. Афроамериканцы представляют собой в значительной степени результаты «скрещивания» преимущественно черных индивидуумов африканского происхождения с преимущественно белыми индивидуумами европейского или какого-либо другого происхождения. Различаемые в психологических исследованиях расовые группы определяются не биологическими, а социальными признаками. Другими словами, люди причисляются к конкретной расе по их словам, а не по тому, где они родились.

Имеются интересные факты, указывающие на то, что различия «белые-черные» не являются по своей природе генетическими, а определяются прежде всего внешними условиями. Например, дети нескольких сотен немецких детей, родившихся в результате связи их матерей с чернокожими американскими солдатами во время Второй мировой войны, имеют IQ, который совпадает в пределах половины одного очка с IQ тех, в происхождении которых были аналогичным образом замешаны белые американские солдаты. Более того, среди детей, появившихся в союзах белых и черных родителей, более высокий IQ отмечается в тех случаях, когда к белой расе принадлежит мать. Это опять-таки указывает на социальную, а не на генетическую природу обсуждаемых различий.

Еще один момент. Психолог из Мичиганского университета Ричард Нисбет изучил соответствующую литературу и обнаружил семь опубликованных исследований, в которых сравниваются генетические и связанные с внешними условиями аспекты различий IQ для белого и черного населения. В отличие, например, от изучения близнецов, эти исследования были непосредственно направлены на выявление природы отличий белых людей от черных. В шести из них не удалось найти каких-либо свидетельств в пользу генетического происхождения различий. А исследования Скарра и Вайнберга 1976 года кажутся весьма сомнительными. Не совсем ясно, как должны интерпретироваться их результаты, хотя сами авторы считают, что они не свидетельствуют в пользу генетической точки зрения. Любопытно и достаточно грустно то, что Хернштейн и Мюррей подробно обсуждают только одно это неоднозначное исследование, и, как и следовало ожидать, их интерпретация результатов противоположна той, что приводят сами авторы. В данном случае (равно как и во всей их книге) игнорируются факты, не соответствующие гипотезе этих авторов, а допускающие неоднозначную интерпретацию факты неизменно подгоняются под их социально-политические взгляды.

Является ли величина IQ причиной групповых различий, связанных с достижением определенного положения и успеха в обществе? Хернштейн и Мюррей не сомневаются в этом. Вся их книга направлена на подтверждение данной точки зрения. И в этом они не одиноки. Те же позиции занимает и Дженсен, и многие другие. Но что любопытно, собственные данные Хернштейна и Мюррея не подтверждают выдвигаемых ими гипотез. В одном из своих исследований они обнаружили, что по сравнению с белыми у негров с таким же средним значением IQ в два раза выше вероятность проживания в бедности, более чем в пять раз выше вероятность рождения вне брака, в три раза выше вероятность существования за счет благотворительности, более чем в два раза выше вероятность проживания в бедности в течение первых трех лет жизни, и в два раза выше вероятность малого веса при рождении. Эти данные не подтверждают вывод о том, что именно IQ определяет способность к адаптации в описанных ситуациях, поскольку IQ для обеих групп был одинаков.

Еще в начале века паникеры от социологии указывали на групповые различия IQ и предупреждали о страшной угрозе таких различий – их пугал не сам факт существования расхождений, а то, что несовпадение скоростей воспроизводства в различных группах с неизбежностью приведет к понижению интеллекта нации в целом. Если, как утверждают эти «ученые», люди, занимающие низшие ступени общественно-экономической лестницы и соответственно имеющие более низкие IQ, воспроизводят себя быстрее, то независимо от того, определяется интеллект генами или внешними условиями, средний IQ в стране будет неуклонно понижаться, поскольку «второсортные» родители будут с опережающим темпом обеспечивать общество и недостойными генами, и плохими внешними условиями.

Эта гипотеза имеет успех у многих паникеров, несмотря на тот факт, что за последние тридцать лет или около того IQ вырос более чем существенно – на величину полного стандартного отклонения (примерно 15 пунктов IQ). Подобный рост, который называют «эффектом Флинна» (по фамилии его открывателя, Джеймса Флинна[11]), является камнем преткновения для наших паникеров, и, похоже, объяснить его им никак не удается. Эффект Флинна наблюдается не только в Соединенных Штатах. Он отмечен во многих странах по всему миру. Фактически, тот человек, который сегодня имел бы показатель IQ 85 пунктов, всего пару поколений тому назад набрал бы средний показатель примерно 100 пунктов.

По поводу эффекта Флинна имеется масса спекуляций, но убедительные объяснения отсутствуют. Среди вероятных причин могут быть и лучшее образование, и лучшее питание, и школьная реформа – но это только догадки. Точно известно лишь то, что вопреки прогнозам о снижении интеллектуальные способности нации в среднем возрастают.

Однако сегодня мы столкнулись с проблемой другого рода, которая свидетельствует об определенной деградации. Наряду с ростом средних показателей IQ, наблюдается снижение результатов некоторых тестов, которые используются при отборе абитуриентов в колледжи. Безусловно, эти тесты оценивают лишь часть способностей человека. Но они свидетельствуют о снижении так называемых «академических» навыков. Многие профессора, включая и автора этих строк, обратили внимание на снижение в последние годы вербальных способностей студентов, то есть способностей, связанных с владением речью. Снижение оказалось настолько существенным, что после многих лет использования неизменных норм для оценки SAT Государственная служба тестирования в образовании была вынуждена провести перенормировку тестов, приняв в качестве среднего показатель 500 пунктов.

Низкие показатели не связаны, как многие могут подумать, с ухудшением ситуации с менее способными членами общества. Хотя мы теперь и имеем больше посредственных результатов, эта тенденция связана прежде всего с различиями в выборках тестируемых детей. Сейчас тестирование проходят значительно больше учеников и студентов, чем это имело место в 50-е, 60-е и даже 70-е годы, когда показатели были выше. Раньше тестировались лишь лучшие ученики, теперь охватываются практически все. Реальная проблема состоит как раз в снижении наиболее высоких результатов. До перенормировки тестов особенно бросалось в глаза уменьшение показателей в районе 600 и 700 пунктов, т. е. речь идет о верхней части шкалы. Почему происходит понижение верхней планки? Я полагаю, здесь наиболее вероятны следующие три причины.

Во-первых, приносит свои плоды присущая нашей нации озабоченность проблемами «неблагоприятных» людей. Люди с низкими способностями, безусловно, требуют особого внимания, но не меньшего внимания заслуживают и обладатели высоких способностей. Наши национальные приоритеты проявляются в том, что 99,9 процента бюджета специального образования направляется на нужды представителей нижней части шкалы измерения способностей. А это является откровенной глупостью. Наши одаренные дети (под одаренностью я подразумеваю весь спектр способностей и талантов, а не только IQ), вероятно, составляют наиболее ценные ресурсы нации. Они – наша главная надежда в мире все возрастающей конкуренции. А в начальной и средней школе им уделяется гораздо меньше внимания, чем детям с различного рода трудностями. Считается, что одаренные дети сами пробьют себе дорогу. Их относят к категории, меньше нуждающейся в помощи. А это неверно. Помощь нужна им не меньше, чем их сверстникам с более низкими способностями. Часто им приходится учиться в условиях, которые нагоняют на них тоску и зарождают ненависть к школе. Один из моих подопечных, без сомнения гений в математике, был вынужден две трети года, котрые он провел в обычной школе, повторять разделы математики, которые он уже давно знал. Это пустая трата времени и неуважение к способностям. Никому не проходит в голову научить таких детей тому, как наилучшим образом использовать данный им свыше дар.

Во-вторых, наблюдается систематическое «оглупление» наших учебников. На этот факт указала Салли Райс из Университета штата Коннектикут, проводившая исследования по заданию Министерства образования США. В среднем учебники опустились на три уровня согласно принятой градации по сравнению с тем временем, когда я учился в начальной школе – примерно тридцать лет назад. Стали примитивнее и учебники для младших классов. В качестве автора учебных пособий я ни разу не испытывал давления с целью заставить меня повышать уровень содержания, напротив, от меня требовали понижать уровень сложности.

Очень просто обвинить во всем издателей. Кто им позволил калечить наших детей? Но проблема не в издателях, проблема в школах. Что школы покупают, то издатели и выпускают. Если школа потребует учебники высокого уровня, издатели будут выпускать именно такие учебники. Захотят школы книги с прекрасными цветными иллюстрациями – пожалуйста. Цель издателей – получать прибыли, поэтому они выпускают для своих заказчиков все, что они требуют.

В нашей стране мы все говорим о высоких стандартах – многочисленные государственные и общественные структуры только и твердят об этом. Но все разговорами и заканчивается, а конкретных действий нет. Когда издатели выпускают учебник относительно высокой сложности, его не покупают. Массовый рынок делает ставку на примитивный уровень, и издатели знают об этом. Приобретая учебники, и представители среднего образования, и даже профессора колледжей покупают что попроще, чтобы не дай бог не ущемить самолюбие своих подопечных. Но при этом ученики и студенты не получают действительно стоящую пищу для ума.

Наше лицемерие не ограничивается одним лишь образованием. Я посетил уже, наверное, две дюжины стран, и у меня сложилось впечатление, что ни в одной из них нет стольких людей с избыточным весом, сколько в Соединенных Штатах. Какое же предлагается решение? Мы повышаем уровни веса, которые считаются допустимыми для соответствующего возраста! А тем временем смертность от сердечно-сосудистых заболеваний возрастает. Как поступили производители одежды, обнаружив, что спрос на малые размеры падает и все больше и больше женщин вынуждены покупать более крупные размеры, изрядно при этом смущаясь и расстраиваясь? Они изменили маркировку размеров одежды, и теперь толстые женщины покупают себе меньшие размеры и остаются очень довольными. Конечно, можно изменить этикетку, но сама вещь от этого не меняется, как не решается и существующая проблема. Мы можем написать на учебнике «для шестого уровня», но судить-то надо по содержанию, а правда в том, что это содержание становится все примитивнее для всех уровней.

В своей книге «Пробел в обучении» Гарольд Стивенсон из Мичиганского университета и Джеймс Стиглер из UCLA описали интересный парадокс. Сравнивая японских и американских родителей, авторы обнаружили, что наши соотечественники гораздо больше удовлетворены достижениями своих детей, чем японские родители, несмотря на то что у американских детей фактические показатели заметно ниже. Американские родители убеждены, что дела идут хорошо и со школами у нас полный порядок. «О недостатках школы говорят лишь безответственные злопыхатели». И талии у наших женщин тоже замечательные. Наша национальная способность к самообману просто поражает! И то, что мы наблюдаем, путешествуя по всему миру, не способно раскрыть нам глаза. Если появляются проблемы с результатами тестирования наших детей, можно в любой момент провести перенормировку тестов – дети без проблем будут получать нужные оценки по чтению, спотыкаясь при этом на каждом слове. Цена этого самообмана – неизбежное падение конкурентоспособности нации. По-моему, слишком высокая цена, а со временем она станет еще выше. Нам необходимо повышать уровень интеллекта нации, а не понижать его.

Интеллект может изменяться

Интеллект человека и даже его IQ не являются чем-то застывшим. Когда-то и я считал интеллект неизменным – по жизни человек идет с тем, что достается ему при рождении. Сегодня многие ученые, занимающиеся исследованиями интеллекта, а возможно, даже большинство из них считают его достаточно пластичным – определенные вмешательства позволяют придавать ему желаемые формы и даже способствовать его росту[12].

В качестве примера приведем программу «Head Start», выполнявшуюся в шестидесятые годы с целью формирования у маленьких детей к моменту их поступления в школу необходимых зачатков интеллектуальных способностей и практических навыков. Долгосрочные наблюдения за участниками программы показали, что к подростковому возрасту дети, которые участвовали в программе, по своему развитию примерно на год опережали не участвовавших в программе школьников из контрольной группы[13]. Те, кто прошел подготовку, показывали более высокие результаты в тестах оценки способностей к учебе, у них было меньше проблем с поведением, и они, как правило, не требовали особого внимания педагогов и медиков. Хотя перечисленные показатели не отражают непосредственно уровень интеллекта, были выявлены сильные положительные корреляции описанных показателей с результатами традиционных тестов умственных способностей. В ряде более поздних программ были продемонстрированы определенные успехи, которых удавалось добиться, действуя вне рамок домашних и семейных условий. Интересным примером здесь служит «Азбучный проект» Рами и Кэмпбелла (1984, 1992), который позволил в ряде отдельных случаев заметно повысить интеллектуальные способности школьников.

В исследованиях Роберта Бредли и Бетти Колдуэл было показано важное значение домашней среды с точки зрения развития интеллекта у маленьких детей. Эти ученые выявили заметную корреляцию высоких результатов IQ-тестов с рядом факторов в ранней (дошкольной) домашней обстановке: эмоциональная и вербальная отзывчивость главного воспитателя и степень его участия в развитии ребенка; недопустимость необоснованных ограничений и наказаний; организация соответствующей обстановки и активного графика; разнообразие повседневных стимулов и поощрений и возможность их выбора. Кроме того, Бреди и Колдуэл установили, что эти факторы значительно сильнее влияют на рост IQ, чем переменные, отражающие социально-экономический статус или структуру семьи, например количество детей в семье.

Домашняя обстановка особенно важна для детей, потерявших родных и близких. Так, Вэйн Деннис, американский психолог, работавшая в Иране, показала, что дети из ряда сиротских приютов этой страны, которых не усыновили или не удочерили в возрасте до двух лет, как правило, становятся умственно отсталыми. У детей, которые обрели приемных родителей, умственное развитие было в норме. В данном случае не было серьезного вмешательства психологов – дело было в различии условий стимуляции интеллекта и условий воспитания в соответствующих средах. Причем речь идет об очень серьезных вариациях показателей – примерно 50 пунктов IQ. Таким образом, если диапазон изменения качества внешних условий широк, среда может иметь огромное значение. На практике даже скромная, но адекватная среда способна заметно улучшить IQ ребенка, а возможно, и другие аспекты его интеллектуальных способностей.

Одной из наиболее впечатляющих программ совершенствования интеллектуальных способностей был «Проект Одиссей», выполнявшийся в Венесуэле. Проект действовал в период существования в этой стране Министерства развития интеллекта – уникальной ситуации в истории человечества, когда целое государственное учреждение занималось на национальном уровне повышением интеллекта населения[14]. Программа охватывала широкий спектр аналитических и творческих способностей, а результаты ее тщательно оценивались. Принятая при этом система оценки может быть использована в качестве модели контроля подобных программ, поскольку в ней использовался широкий диапазон критериев оценки успешности программы. Результаты исследований были опубликованы в одном из наиболее престижных психологических журналов.

Я упомянул эту программу главным образом для того, чтобы отдать дань авторам системы ее тщательного оценивания, а именно Ричарду Хернштейну и его коллегам (Рэю Никкерсону, Маргарите де Санчес и Джону Светсу). Эти исследования выполнялись в рамках «Проекта интеллекта», целью которого было развитие интеллектуальных способностей у венесуэльских школьников. Хернштейн был тем же самым человеком, который позже на страницах книги «Кривая Белла» написал, что попытки повысить интеллектуальный уровень потерпели сокрушительную неудачу, что это был типичный пример необоснованных претензий, которые никогда не могут быть реализованы на практике. С одной стороны, можно удивляться тому, что соавтор успешной программы и главный автор системы ее оценивания делают затем заключение, что подобные программы обречены на неудачу.

Но, с другой стороны, в этом нет ничего удивительного. Многие области науки настолько политизированы, что в посвященных им дискуссиях часто доминируют не научные, а именно политические подходы. Исследования интеллекта, безусловно, можно отнести к таким наукам, особенно когда речь идет о возможности его совершенствования или о групповых различиях. Политические аргументы сыплются с обеих сторон – и справа, и слева, а опасность политизации заключается как раз в том, что в подобной шумихе могут затеряться действительно научные доводы.

Необходимо различать подлинное совершенствование интеллектуальных способностей от рутинной подготовки к выполнению тестов. Существует, например, немало пособий и курсов, с помощью которых можно повысить результаты тестирования. Эти пособия позволяют «набить руку» на упражнениях, которые чаще других встречаются в стандартных тестах, что имеет слабое отношение к повышению интеллектуального уровня. Я вовсе не утверждаю, что эти пособия и курсы абсолютно бесполезны. Моим детям довольно скоро предстоит прохождение SAT-тестов. Я им купил одно из пособий и буду только рад, если они им воспользуются. Знаю, что этим они не повысят свой интеллект, но могут повысить результаты выпускного тестирования, что позволит поступить в выбранный ими колледж. В среднем такие курсы и пособия позволяют получать заметный выигрыш при выполнении стандартизованных тестов[15]. Умные люди не особо жалуют все эти тесты, но признают необходимость показывать результаты, достаточные для прохождения определенных барьеров в системе образования. Поэтому они не пренебрегают возможностями повышать эти результаты не потому, что это важно для них, а потому, что наше общество придает им, пусть и неоправданно, столь большое значение.

В связи с этими книгами и курсами возникает проблема равноправия. Дело в том, что не у всех найдутся на них время и деньги. И те, кто не может себе их позволить, оказываются в менее выгодном положении. Более того, люди, у которых есть на это свободные средства и время, распределены среди населения далеко не случайным образом. Как правило, это представители средних и верхних средних классов нашего общества. Опять-таки, тесты в среднем больше благоволят тем, кто имеет более выгодные стартовые позиции.

То, о чем мы только что говорили, является частным случаем проявления так называемого «эффекта Матфея». В Библии именно Матфею принадлежат слова о том, что богатые будут со временем богатеть, а бедные – становиться беднее. И это относится не только к деньгам. Эффект Матфея ведет к усилению поляризации при распределении различных ресурсов в обществе – это наблюдается сейчас и в Соединенных Штатах, и в других странах, – а также к обострению противоречий и непонимания между имущими и неимущими.

Что любопытно, в школах, особенно в старших классах, все больше занятий посвящается непосредственной подготовке к тестам. В один из родительских дней я присутствовал на уроке английского языка у моей дочери и наблюдал, как ученики запоминают, а затем повторяют вслух значения трудных слов. Фактически урок был слегка замаскированной подготовкой к SAT-тесту. Вина в этом не только педагогов: они находятся под постоянным давлением как родителей, так и чиновников, заинтересованных в повышении результатов тестирования. Но усвоенный подобным образом словарь очень скоро забывается, поскольку новые слова поступают в память неинтегрированно, вне контекста. Детей не учат, как использовать эти слова и увязывать их с уже накопленными знаниями.



Поделиться книгой:

На главную
Назад