Известны также случаи, когда поведение паразитов запечатлевается на вид их хозяина; например, как показал Г. Торп, наездники[77] откладывают яйца в тот вид гусениц моли, из которого они сами вылупились. Посредством «трансплантации» личинок можно запечатлеть на мучную моль наездников, нормально паразитирующих на восковой моли. У муравьев, как показал Брун, каждый индивид фиксирует свои социальные реакции на том виде муравьев, представители которого оказывали ему помощь, когда он вылупливался из куколки. На этом основывается так называемое рабовладение у многих видов муравьев. Моника Гольцапфель показала, что поведение ловли добычи у сов запечатлевается на определенный вид животных, служащих добычей; более того, если в течение сенситивного периода это запечатление не произошло, то индивид навсегда остается неспособным поймать добычу.
Запечатление связано множеством переходов с другими процессами ассоциативного обучения. Так, например, обучение характерному для вида способу пения у многих певчих птиц, как показал М. Кониси, точно так же связано с некоторым сенситивным периодом и точно так же необратимо, как типичные процессы запечатления. Такие переходы приводили к недоразумениям. Многие авторы, в том числе Р. Хайнд, П. Бейтсон и другие, изучали процессы, вполне отчетливо отличающиеся от типичных процессов запечатления, такие, как процесс присоединения цыпленка курицы к матери или к некоторому замещающему объекту. Такие явления больше похожи на обычные процессы обучения, чем на типичное запечатление. На основании полученных при этом результатов были подвергнуты сомнению наблюдения Ч. О. Уитмена, О. Гейнрота и мои. Между тем современные результаты К. Иммельмана, М. Шейна, М. Кониси, Ф. Шутца и других полностью подтвердили все установленное прежними авторами уже более двадцати лет назад.
Так же как привыкание и приучение, запечатление «ассоциируется» с комплексными процессами распознавания образов, и так же как в тех двух процессах, при запечатлении выученное "закладывается во врожденный механизм запуска". Тем самым процесс запечатления делает этот механизм более избирательным.
Одна из самых интересных и загадочных функций запечатления состоит в том, что оно осуществляет при восприятии запускающей комбинации стимулов замечательную абстракцию. Сексуальные реакции селезня кряквы, воспитанного в обществе самки пеганки, запечатлеваются не на этот индивид Tadorna tadorna L., а на этот
Не решен также вопрос, не играют ли все же некоторую роль в процессе запечатления какие-то вознаграждающие, т. е. дрессирующие, стимулы; иначе говоря, нельзя ли истолковать запечатление как условную реакцию (conditioned response) в смысле И. П. Павлова и американских исследователей психологии обучения. Против этого говорит то уже упомянутое обстоятельство, что запечатленный объект часто оказывается твердо детерминированным к такому моменту времени, когда животное ни разу еще не выполнило, даже в виде слабого намека, относящуюся к этому объекту форму поведения. Например, галка незадолго до вылета из гнезда сексуально запечатлена, хотя можно с уверенностью утверждать, что к этому моменту у нее никогда не было даже намека на сексуальное настроение. Должно пройти еще два года, прежде чем у нее пробудится инстинктивное поведение копуляции, которое, как надо полагать, должно производить важнейшее дрессирующее действие в качестве окончательного акта, удовлетворяющего побуждение. Впрочем, этим не вполне исключается возможное участие других дрессирующих стимулов, еще не распознанных как таковые. Но для такого предположения нет принудительных мотивов, и, по всей вероятности, запечатление есть ассоциативный процесс обучения того же рода, что и оба описанных в предыдущих разделах. Ввиду своей необратимости и своей связи с точно определенными фазами онтогенеза запечатление имеет более отчетливый характер
9. РЕЗЮМЕ ГЛАВЫ
В предшествующей четвертой главе были рассмотрены физиологические механизмы, принимающие кратковременную информацию и мгновенно оценивающие, но не накапливающие ее. Все они могут функционировать неограниченное число раз, без каких-либо изменений в их механизме от выполнения этой функции. Они составляют основу любого возможного опыта и как раз по этой причине должны быть защищены от любой модификации опытом.
В настоящей пятой главе был рассмотрен принципиально иной процесс, изменяющий в течение индивидуальной жизни самый механизм поведения, и притом таким образом, что улучшается его функция, способствующая сохранению вида.
Улучшение функции некоторой структуры и повышение ее ценности для сохранения вида посредством модификации не более вероятно, чем посредством мутации или рекомбинации наследственных задатков. Но если определенные внешние обстоятельства регулярно вызывают определенные модификации, осуществляющие приспособление
Такая генетическая программа содержит
Тем самым центральная нервная система повторяет на высшем уровне функцию, уже присущую геному, но отсутствующую у процессов приобретения текущей информации, описанных в четвертой главе.
Любое обучение есть телеономная модификация тех физиологических механизмов, функцией которых является поведение.
Надежную модель открытой программы и адаптивной модификации доставляет нам механика развития, или экспериментальная эмбриология. Какая из "проспективных потенций" некоторой эмбриональной ткани будет осуществлена, зависит от «индуцирующих» влияний окрестности. Все процессы адаптивной модификации, в том числе процессы обучения, по существу, близки к индукции в смысле Шпемана.
Простейшие формы адаптивных модификаций поведения — это прокладывание моторных путей и сенситивизация рецепторных процессов. Последние имеют значение для сохранения вида лишь в тех случаях, когда стимулирующая ситуация с высокой вероятностью появляется в виде
Все дальнейшие процессы модификации, рассмотренные в этой главе, основываются на
В случае привыкания, или десенситивизации, это влияние имеет
При обратном процессе приучения врожденно действующие ключевые стимулы ассоциируются с некоторой комплексной комбинацией стимулов таким образом, что
При интенсивных реакциях бегства запускающие ключевые стимулы часто уже после единственного очень сильного воздействия, именуемого "психической травмой", ассоциируются с сопровождающей комплексной стимулирующей ситуацией, в дальнейшем вызывающей сильное побуждение к бегству. Эта ассоциация часто необратима.
Многие формы поведения, в особенности социального, в ранних сенситивных фазах развития, в которых они еще вовсе не способны функционировать, необратимо фиксируются на некотором объекте. Эти процессы, именуемые запечатлением, своей связью с некоторым сенситивным периодом и своей необратимостью более всех процессов обучения напоминают явления, которые Шпеман назвал индукцией и детерминацией.
В процессах, рассмотренных в четвертом — седьмом разделах этой главы, посредством обучения устанавливается новая связь между независимо функционирующими нервными процессами. Представление об обучении в общем смысле, которого придерживались старые психологи — исследователи поведения, такие, как Вильгельм Вундт и Ч. Л. Халл, весьма точно подходит к описанным процессам. Но если критически сопоставить различные американские теории обучения, как это сделал К. Фоппа в своем прекрасном сжатом обзоре, то снова и снова бросается в глаза, сколько вреда причиняет теоретическим построениям большинства авторов описанная на с. 278–279 тенденция к единообразному объяснению. Снова и снова пытаются справиться со
Глава 6
ОБРАТНОЕ СООБЩЕНИЕ ОБ УСПЕХЕ И ДРЕССИРОВКА ВОЗНАГРАЖДЕНИЕМ
(conditioning by reinforcement)
1. НОВАЯ ОБРАТНАЯ СВЯЗЬ
Все животные, у которых центральная нервная система достигла определенного уровня дифференциации, т. е. головоногие, ракообразные, паукообразные, насекомые и позвоночные, включая человека, обладают способностью к приобретению знаний, превосходящей своей эффективностью все до сих пор рассмотренные когнитивные механизмы, а именно способностью к обучению в более узком смысле слова. У психологов, далеких от биологии и ничего не знавших о конвергентном[79] приспособлении, наличие этой способности у столь многих различных организмов вызвало ошибочное представление, что здесь идет речь о первичном феномене, об основной форме любого приобретения знаний или даже о единственном элементе поведения вообще. В действительности же пять указанных групп животных развили свой нервный аппарат, лежащий в основе рассматриваемой функции, столь же независимо друг от друга, посредством конвергентного приспособления, как они выработали свои глаза и конечности, также независимо возникшие в каждой из этих групп.
Обучение посредством проб и ошибок возникло как типичная фульгурация в смысле, объясненном на с. 270, посредством установления новой связи между уже существовавшими механизмами, способными действовать независимо друг от друга. Мы уже познакомились с функцией каждого из этих составляющих механизмов.
Комплекс поведения, который Гейнрот назвал свойственным виду импульсивным поведением (arteiegene Triebhandlung), состоит, как мы уже знаем, из аппетентного поведения срабатывания врожденного механизма запуска и выполнения генетически запрограммированной последовательности поведения с достижением в конце ее завершающей ситуации, удовлетворяющей побуждение. Эта цепь из трех отдельных процессов представляет основу, из которой возникло все обучение посредством проб и ошибок (conditioning). Линейная последовательность процессов приобретает новые неожиданные системные свойства вследствие поистине эпохального «изобретения»:
Формы поиска, более или менее случайно входившие в аппетентное поведение,
Вместе с новой обратной связью возникает когнитивный процесс, доставляющий индивиду за один раз больше прочного знания, чем метод генома мог бы доставить, в самом благоприятном случае, в течение целого поколения, — по меньшей мере вдвое больше, поскольку этот процесс может извлекать информацию не только из успеха, как геном, но также и из неудачи. Кроме того, рассматриваемый процесс действует не так, как геном, «пробующий» наудачу всевозможные существенные и несущественные факторы, а опирается на надежно испытанные врожденные рабочие гипотезы, а именно на те, которые прочно встроены в систему поведения всех высших животных в виде механизмов приобретения текущей информации, описанных в главе 4. Тем самым поведение, модифицируемое методом проб и ошибок, заранее направляется в сторону большей вероятности успеха. Не случайно «заранее» по-латыни звучит "a priori".[84] Мы узнаем об этом больше в разделах, посвященных пониманию и обучению.
Ввиду большой эффективности возникающего таким образом нового когнитивного аппарата понятно, что из быстро движущихся высших животных способны к конкуренции лишь те, которые им обладают.
2. МИНИМАЛЬНАЯ СЛОЖНОСТЬ СИСТЕМЫ
С другой стороны, из сказанного понятно, почему обучение посредством успеха не могло возникнуть у одноклеточных и низших многоклеточных животных, лишенных центральной нервной системы. Система, способная оценить как источник знания успех или неудачу некоторой предыдущей формы поведения и применить результат такой оценки для обратного модифицирующего действия на механизм этой формы поведения, имеет, разумеется, своей предпосылкой существование нескольких не слишком простых, весьма эффективно действующих подсистем. Эти подсистемы и их образ действия мы рассмотрели при обсуждении свойственного виду импульсивного поведения.
Легче всего представить себе механизм, подкрепляющий животное в тех формах поведения, которые ведут к простому удовлетворению потребностей тканей. В этом случае достаточен был бы единственный "датчик",[85] регистрирующий наличие или отсутствие некоторого необходимого для жизни вещества и посылающий свое сообщение в аппарат предыдущего поведения. Такая простейшая возможность подлинной условной реакции и в самом деле осуществляется в отдельных случаях, например, по наблюдениям Детье, при добывании пищи у многих мух. Но, вообще говоря, для большинства систем поведения, адаптивно модифицируемых подлинным обучением, должны быть выполнены следующие три предпосылки.
Во-первых. Форма поведения, с которой начинается все действие, должна быть "широко открытой", т. е. иметь программу, предоставляющую возможность разнообразных адаптивных модификаций; как мы уже знаем, такая программа предполагает особенно
Во-вторых. Должна каким-то образом "заноситься в протокол" или «запоминаться» форма, какую имели вводные звенья цепи действий при ее последнем выполнении, и эта запись должна связываться с обратным сообщением об успехе.
В-третьих. Это обратное сообщение должно быть достаточно
Система поведения, способная к такой функции, тем самым никак не может быть простым «рефлексом», как это подсказывает терминология И. П. Павлова. Конечно, существуют простые «рефлекторные» реакции избегания, подобные рассмотренным в 5.6, которые возникают путем простой ассоциации между реакцией бегства и приобретенным запускающим действием некоторой стимулирующей ситуации; они имеют внешнее сходство с рассматриваемыми здесь процессами обучения. Но нам не известен ни один случай, когда бы удалось адаптивно модифицировать некоторую систему поведения посредством дрессирующих, т. е. положительно действующих, «вознаграждающих» стимулов
Даже в классическом случае слюнных условных «рефлексов», исследованном И. П. Павловым, указанный рефлекторный процесс никоим образом не является единственным процессом, подкрепляемым дрессировкой; более того, слюноотделение составляет лишь малую часть гораздо более сложной последовательности форм поведения, большая часть которых, однако, в классическом лабораторном опыте выключается той простой мерой, что собака привязывается тщательно продуманной кожаной сбруей, едва ли позволяющей ей сделать какое-нибудь движение. Мой покойный друг Говард Лиделл, работавший в качестве приглашенного сотрудника в одной из павловских лабораторий, вызвал там некоторое неприятное удивление, произведя неортодоксальный опыт. Сначала он выдрессировал собаку на условный стимул, состоявший в ускорении звуков метронома. Когда собака научилась надежно выделять слюну на этот стимул, Лиделл освободил ее от уз. Тогда собака сразу же подбежала к метроному, продолжавшему равномерно тикать, подпрыгнула к нему, приветствовала его, виляя хвостом и подвывая, иначе говоря, продемонстрировала все поведение собаки, выпрашивающей еду у хозяина или старшего товарища по своре. При этом она интенсивно выделяла слюну, хотя метроном не ускорил своего хода, так что условный стимул вовсе не предлагался. У общественных псовых (Canidae) выпрашивание корма и взаимное кормление широко распространены. Согласно Крайслеру, волки уже в возрасте одного года кормят чужих более молодых детенышей, у гиеновых собак (Lycaon pictus L.) удачливый охотник кормит всех членов своры. У обоих этих видов врожденные координации выпрашивания те же, что у домашней собаки. Эти координации — а вовсе не одно только отделение слюны — воплощают ту реакцию, которая в классическом опыте выступает в качестве условной!
Я никоим образом не хочу преуменьшить значение опытов Павлова. Вполне законно искусственно изолировать некоторую отдельную реакцию, особенно если это доставляет такие хорошие возможности количественного исследования, как слюноотделение собаки. Но при этом не следует упускать из виду, что в таком случае мы
Если мы теперь бросим взгляд с точки зрения биологического системного анализа на важнейшие известные в настоящее время факты о возникновении условных реакций при
3. ПОИСК ЭНГРАММЫ
Прежде чем обратиться к вопросу, на какие части всей модифицируемой обучением системы воздействует адаптивная модификация и откуда происходит новая информация, воздействующая на них, я хотел бы высказать некоторые общие соображения о физиологической природе обучения и памяти.
Поиск
4. ВРОЖДЕННЫЕ НАСТАВНИКИ
Открытая программа тех механизмов поведения, которыми каждый индивид благодаря эволюционному развитию его предков снабжается в начале жизненного пути, всегда сконструирована надежно испытанным способом, так, что оставленные открытыми переменные части ее относятся к условиям окружающей среды,
С другой стороны, как мы знаем, именно открытая программа имеет своей предпосылкой большую массу филогенетически приобретенной, связанной с геномом информации. Эта информация превращается в целесообразное поведение животного не посредством морфогенетического[92] развития, а иным путем. Конечно, сначала морфогенез создает на основе этой информации вполне определенные нейтральные устройства, как, например, описанную на с. 312 врожденную установку обучения, позволяющую мгновенно ассоциировать очень сильный стимул к бегству со всей сопровождающей его стимулирующей ситуацией. Далее, вся описанная в 6.2 структура аппарата подкрепления успехом построена, разумеется, на основе информации, заключенной в геноме. И если мы хотим остаться в пределах естественнонаучного объяснения, то нельзя себе представить, чтобы заключенная в геноме информация могла превращаться в способствующее сохранению вида поведение каким-нибудь иным способом, чем посредством построения реальных структур нервной системы и органов чувств.
Именно это структурирование направляет обучение на целесообразные пути. Из него вырастают «наставники», заботящиеся о том, чтобы открытые места различных программ всегда заполнялись способом, содействующим сохранению вида. Как уже не раз говорилось, сами эти структуры должны быть как можно меньше подвержены изменению вследствие модификации, чтобы ничего не потерять из содержащейся в них врожденной информации. Если в некоторой системе форм поведения имеется подсистема, способная сильно модифицироваться обучением, это неизбежно предполагает, что другие подсистемы достаточно резистентны по отношению к модификациям, чтобы обеспечить выполнение учебной программы модифицируемых частей.
Если не допускать сверхъестественных факторов, например предустановленной гармонии между организмом и окружающим миром, то необходимо постулировать существование врожденных механизмов обучения, чтобы объяснить функции большинства процессов обучения, очевидным образом способствующие сохранению вида. К числу условий возможного опыта принадлежат и те наставники, которые соответствуют Кантову определению априорного: эти врожденные наставники — то, что предшествует любому обучению и должно ему предшествовать, чтобы сделать обучение возможным.
Для естествоиспытателя в высшей степени захватывающее предприятие — разыскивать в некоторой комплексной системе форм поведения, способной к функционированию лишь при адаптивной модификации посредством обучения, те места, где содержится генетически закрепленная открытая программа процессов обучения. Лежащая в основе всего этого информация, связанная с геномом, может быть заложена в самые различные механизмы органов чувств и нервной системы. Например, она может быть сосредоточена в чисто рецепторных механизмах. При типе поведения, который Уоллес Крейг назвал
Другой вид возникновения условных реакций, столь же широко распространенный и имеющий столь же простую врожденную программу, выполняет важную функцию — сохраняет посредством внешнего поведения постоянные условия внутри организма, т. е. обеспечивает с помощью целесообразных реакций
Еще один пример механизма, сообщающего о неблагополучии уже в несколько ином смысле, — чувство боли. Его особая функция — локализация помехи: мы сразу узнаем,
Врожденный механизм обучения, производящий эти условные реакции, используя неприятные самочувствия как «наказания» и приятные — как подкрепления, может программироваться очень общим образом. Такому механизму достаточно иметь датчики, в смысле техники управления, в различных регулирующих контурах организма, наказывая за любое изменение, отклоняющееся от желательного номинального значения, и вознаграждая за любое изменение, приближающееся к нему. На этом принципе и в самом деле основывается механизм, определяющий выбор пищи у многих «всеядных», т. е. животных, потребляющих очень разнообразные питательные вещества. Курт Рихтер давно уже установил, что крысы, которым предлагали различные необходимые для их питания вещества порознь, во множестве отдельных сосудов — так что белки были даже разложены на отдельные аминокислоты, — брали из каждой мисочки ровно столько, сколько требовал хорошо рассчитанный рацион. Поскольку крыса никак не может иметь филогенетически приобретенной информации о том, из каких аминокислот синтезируются обычные для нее белковые вещества и в каких отношениях они туда входят, это знание должно приходить к животным другим путем. Исследования X. Гарсиа и Ф. Р. Эрвина привели к весьма важным результатам о программе врожденного механизма обучения, доставляющего крысе такую информацию. Ее можно приучить или отучить от употребления некоторого вида пищи
Как в адаптивных модификациях аппетентного поведения, стремящегося к состояниям покоя, так и в только что описанных самодрессировках на определенные виды пищи на передний план выступают условные реакции
Существуют также модифицируемые системы поведения, в которых врожденная информация содержится не только в рецепторных механизмах запуска, анализирующих стимулирующую ситуацию, но и в самих запускаемых наследственных координациях. Хороший пример этого составляет постройка гнезда у галок (Coloeus monedula L.), а также у других врановых (Corvidae). Стоя в центре будущего гнезда, птица выполняет с материалом в клюве толкательное движение со своеобразным дрожанием, направленное по широкой окружности в сторону и немного вниз, которым она прижимает материал к основанию гнезда или к уже построенным его частям и втыкает его в эти места. Если материал наталкивается при этом на сопротивление, то дрожательное движение усиливается и непрерывное во времени толкание превращается в ряд сильных ударов в одном направлении, механическое действие которых несколько напоминает действия человека, чистящего трубку, когда введение чистителя в отверстие трубки наталкивается на сопротивление. И если птица держит ветку или что-нибудь в этом роде, то она продвигает этот предмет до тех пор, пока наконец после ее длительных усилий он не пристает таким образом, что его нельзя уже передвинуть ни вперед, ни назад. Когда это происходит, движения "дрожательного толкания" достигают своего оргиастического максимума и внезапно прекращаются. Птица теряет теперь всякий интерес к объекту, а на какое-то время и вообще к постройке гнезда. Дрожательное толкание с его внезапным, удовлетворяющим побуждение концом — это типичный пример завершающего действия, "consummatory act" в смысле Уоллеса Крейга.
В отличие от многих других певчих птиц, галки и другие врановые явно не имеют локализованной в механизме запуска информации о том, что подходит для постройки гнезда. Когда у них впервые пробуждается стремление к этому, они приносят самые невероятные предметы и пытаются прикрепить их дрожательным толканием к месту, подходящему для постройки гнезда. Знание такого места является, однако, врожденным. Я видел галок и воронов, заталкивающих этим движением осколки стекла, патроны для электрических ламп, даже кусочки льда. Конечно, эти вещи не пристают, так что удовлетворяющее завершающее действие не запускается. И в очень короткое время птица
Сложнее те процессы обучения, которые интегрируют в единую функцию различные инстинктивные движения при постройке крысиного гнезда. Как показал И. Эйбль-Эйбесфельдт, каждая отдельная наследственная координация, входящая в этот процесс, является полностью врожденной. В единственном случае врожденной является также их последовательность: крыса «знает» от рождения, что постройку гнезда надо начинать со сбора материала далеко от места будущего гнезда и доставки его на это место. Крысы, которых Эйбль-Эйбесфельдт вырастил в клетках, не содержавших никаких свободно переместимых предметов, использовали в качестве замещающего объекта собственный хвост, который они брали в зубы далеко от привычного места сна, несли его туда и добросовестно укладывали в надлежащем месте. Поскольку желательно было провести эксперимент с особями без всякого опыта, пришлось повторить его с другими особями, которым в ранней молодости, задолго до проявления побуждений к постройке гнезда, ампутировали хвост. Когда они выросли, им впервые предложили мягкие полоски бумаги, и они сразу же принялись строить. Те из них, которые уже выбрали себе в нерасчлененном помещении определенное место для сна, сразу же стали складывать там принесенные бумажные полоски. У тех, которые до эксперимента спали то в одном месте, то в другом, прошло несколько минут, прежде чем они решились выбрать место для гнезда. Когда отделили угол помещения куском жести площадью в несколько квадратных сантиметров, все подопытные животные стали строить гнезда в этом укрытии.
Строительная деятельность лишенных опыта крыс выразительным образом отличалась от поведения нормальных контрольных животных. Вначале она была намного более интенсивной. Подопытные животные с жадностью набросились на строительный материал, что объяснялось накоплением ни разу не отреагированных инстинктивных движений и чего, конечно, следовало ожидать. Но важное различие состояло в том, что у них
У крыс вся модифицируемая система сложнее, чем у галок, но каждый из множества имеющихся врожденных механизмов обучения действует по тому же принципу. Дрессировка и подкрепление определенной последовательности движений в обоих случаях осуществляются посредством двух процессов. Первый процесс состоит в том, что данная форма наследственной координации может выдать вознаграждающее обратное сообщение лишь при вполне определенной, предусмотренной программой ситуации окружающей среды. Второй же процесс осуществляется обратным сообщением об успехе или неудаче, доставляемым экстероцепторными[93] и, вероятно, также проприоцепторными[94] механизмами.
Если инстинктивное движение, так сказать, тратится впустую, не вызывая никаких реаффрекций, то и это действует, вероятно, так же, как прямая отрицательная дрессировка. Во всяком случае, при непосредственном наблюдении рассматриваемых процессов обучения складывается впечатление, что движение укладки доставляет крысам гораздо больше удовлетворения и выполняется с большим изяществом, если материал для укладывания уже собран, а "движение обойщика" вполне удовлетворяет их лишь в том случае, если вал из строительного материала уже сооружен.
Для читателя, интересующегося теорией обучения, замечу, что процессы обучения, при которых большая часть врожденной информации сосредоточена не в рецепторном секторе, а в самой наследственно координированной форме движения, могут быть включены в понятие "оперантного обучения" (opérant conditioning). Но в этом случае «оперант» состоит не в простом, многократно применимом движении, как, например, царапание или сгребание передней лапой, которое может иногда по чистой случайности иметь подкрепляющий успех, как при нажатии рычажка в ящике Скиннера или в более старомодном "ящике с секретом". Он заключается в высокодифференцированном инстинктивном движении, пригодном лишь для единственной специфической функции, и именно той, ради которой оно выработано эволюцией соответствующего вида.
В случае простого, многократно применимого способа поведения справедливы закономерности, сформулированные Б. Ф. Скиннером для процесса обучения, который он назвал кондиционированием типа R. Первый из этих законов гласит, что сила операнта возрастает, если за ним следует подкрепляющая стимулирующая ситуация. Согласно второму закону, сила уже подкрепленного кондиционированием операнта убывает, если за ним не следует подкрепляющий стимул. Эти законы справедливы, если оперантом является так называемая инструментальная реакция, такая, как пространственное перемещение или другие простые формы движения, служащие различным побуждениям. Они справедливы лишь отчасти, если оперант есть инстинктивное движение, аппетенция которого мотивирует животное. В таком случае предшествующее движение в длительной перспективе, возможно, и подкрепляется успехом, но на ближайшее время оно может даже совсем угаснуть. Пока что побуждение удовлетворено, и действие дрессировки станет заметным, лишь когда оно снова проснется. Но отсутствие подкрепления никоим образом не приводит к тому, что животное отказывается от операнта. Поскольку он является наследственной координацией с автономным побуждением, отсутствие удовлетворения приводит лишь к тому, что животное стремится удовлетворить свою потребность в этой форме движения в других ситуациях и на других объектах, но со все возрастающей аппетенцией.
Важно подчеркнуть эти различия, потому что способ проб и ошибок, описанный уже в случае галок и крыс и наблюдаемый, по существу, в том же виде у очень многих животных, можно спутать с так называемым
В описанных выше процессах инстинктивное движение подвержено собственному автохтонному[95] мотивационному давлению, и эта одна и та же форма движения без изменений испытывается на самых разнообразных объектах. Но при подлинном поведении любопытства организм находится под действием совсем иной мотивации, не зависящей от давления, побуждающего к отдельному инстинктивному движению; это убедительно доказала Моника Мейер-Гольцапфель. При таком поведении животное не испытывает
Особенно интересную и неожиданную локализацию врожденной информации открыл М. Кониси в своих исследованиях развития способности к пению у молодых певчих птиц. О многих видах этой группы известно, что неопытный птенец должен услышать пение взрослого собрата по виду, чтобы у него развилось свойственное виду, нормальное во всех подробностях пение. Как известно, исследования И. Николаи обнаружили тот поразительный факт, что некоторые птицы, например снегири, учатся только у вполне определенных особей, с которыми они состоят в столь же определенных, очень тесных социальных отношениях. Известно было также, что птенцы многих видов, которым приходится учиться путем подражания, выбирают в качестве образца пение своего вида даже в том случае, когда слышат много других птичьих голосов и когда голоса их собратьев по виду вовсе не самые заметные и громкие из всех. Кроме того. Оскар Гейнрот заметил, что воспитанные в изоляции птенцы тех видов, которым необходим образец пения своих собратьев, после длинного ряда попыток производят в конце концов песню, приблизительно напоминающую свойственную их виду. Гейнрот предположил, что это "самоподражание".
Все эти явления находят объяснение благодаря открытиям Кониси. Птицы, у которых он разрушал в самом раннем возрасте орган слуха, взрослыми производили пение, состоявшее скорее из шумов, чем из музыкальных звуков, и лишенное всякой структуры. Это наблюдалось и у таких видов, индивиды которых, выросшие в звукоизолированных камерах, вырабатывали вполне отчетливое видовое пение. Отсюда вытекает удивительный, но неизбежный вывод, что лишенные опыта птицы имеют рецепторный прообраз своего видового пения; Кониси называет его "auditory template".[96] Птица играет своим голосом, тихо напевает подобно лепечущему ребенку, испытывая самые разнообразные комбинации звуков, и сохраняет те из них, которые лучше всего соответствуют свойственному виду акустическому шаблону, предстоящему перед ее «воображением». Тихие напевы, которые наши любители птиц так мило называют "сочинением",[97] носят, таким образом, характер исследовательской игры.
Рассмотренных примеров филогенетически запрограммированных механизмов обучения достаточно, чтобы продемонстрировать три факта, важных в контексте этой книги.
Во-первых. В принципе всегда можно показать соответствующим экспериментальным анализом, в какой подсистеме комплексной модифицируемой системы поведения находится врожденная информация, обеспечивающая возможность выдрессировать у животного целесообразные для сохранения вида формы поведения.
Во-вторых. Ни один процесс обучения не может быть понят, если не известна вся система, адаптивную модификацию которой он осуществляет.
В-третьих. Невозможно сформулировать общие, справедливые для всякого обучения утверждения о том, что именно действует в качестве подкрепления ("reinforcement"). Теория Торндайка, по которой сущностью подкрепления является удовлетворение потребностей тканей, или теория Халла, видящего существенный дрессирующий фактор в снятии нервного напряжения ("relief of tension"), обе подходят лишь к специальным случаям. Физиологическая природа процесса подкрепления должна отдельно исследоваться в каждом случае обучения.
5. МОДИФИЦИРУЕМЫЕ ПОДСИСТЕМЫ И ИХ АДАПТИВНАЯ ИЗМЕНЧИВОСТЬ
В предыдущем изложении и более подробно в моей книге "Эволюция и модификация поведения" (Harvard University Press, 1965) я пытался показать, что невозможно допустить адаптивную модифицируемость
6. УСЛОВНАЯ РЕАКЦИЯ,ПРИЧИННОСТЬ И ПРЕОБРАЗОВАНИЕ СИЛЫ
Как уже было сказано вначале (с. 254), часто случается, что когнитивные аппараты различных уровней интеграции очевидным образом возникают в ходе приспособления к одной и той же внесубъективной обстановке. Нередко такие аппараты встречаются у животных разного уровня развития; нередко обнаруживается, что они функционируют одновременно, но независимо друг от друга у одного и того же вида. Это справедливо и в рассматриваемых дальше случаях.
Как подчеркнул Э. Ч. Толмен в своей книге "Целенаправленное поведение животных и человека", важнейшая функция способности к образованию условных реакций состоит в том, что она дает организму возможность оценить некоторую комбинацию стимулов, которая сама по себе не имеет биологического значения, как
Наблюдая полудиких коз армянского нагорья, я заметил однажды, как уже при первых отдаленных раскатах грома они отыскивали в скалах подходящие пещеры, целесообразно готовясь к возможному ливню. То же они делали, когда поблизости раздавался грохот взрывов. Я вполне отчетливо помню, что при этом наблюдении я внезапно впервые осознал: в естественных условиях образование условных реакций лишь тогда способствует сохранению вида,
Надежное, регулярное "post hoc",[98] служащее предпосылкой того, что некоторая условная реакция выполняет функцию, способствующую сохранению вида, никогда не встречается в естественных условиях без причинных связей, которые в таком случае легко обнаружить. В принципе они присутствуют и тогда, когда экспериментатор перед кормлением павловской собаки регулярно заставляет звучать "сигнал еды". Правда, причинная детерминированность в поведении самого исследователя пока ускользает от нашего анализа.
Как я полагаю, доказательство телеономности условной реакции бросает важный свет на некоторую ошибку Юмова эмпиризма, которую критикует также Карл Р. Поппер в своей книге "Объективное знание". Как показывает Юм, с точки зрения чистой логики ни из какого числа прецедентов нельзя заключить, что та же последовательность событий должна повториться; нельзя даже заключить, что вероятность такого допущения возрастает с числом повторений. В связи с этим логическим тезисом Юм ставит психологический вопрос, как же это получается, что каждый разумный человек с большой уверенностью ожидает, что завтра снова взойдет солнце, что отпущенный камень упадет на землю и, вообще, что все на свете будет дальше происходить, как до сих пор. Великий эмпирист отвечает на этот вопрос, говоря, что это следствие привычки — "custom of habit", — иными словами, это происходит потому, что многократное повторение приводит в действие некоторый механизм ассоциации идей, без которого мы, по словам Юма, были бы вовсе не способны к жизни.
Противоречие между логикой и человеческим здравым смыслом — "common sense", — как показал Поппер, не только привело многих мыслителей к глубокому сомнению в возможности объективного знания, но заставило и самого Юма принять некоторую нерациональную теорию познания. Поппер говорит о нем: "Его открытие, что из повторения невозможно вывести никакую доказательную аргументацию, хотя оно и господствует в нашей когнитивной жизни и в нашем «понимании», привело его к заключению, что рассудочные основания и разум играют в нашем понимании лишь подчиненную роль. Наше «знание» разоблачается как нечто, чему подобает лишь природа веры, более того, веры, не поддающейся защите с точки зрения разума, — то есть нерационального убеждения" (His result that repetition has no power whatever as an argument, al though it dominates our cognitive life or our «understanding» led him to the conclusion that argument or reason plays only a minor role in our understanding. Our knowledge is unmasked as being not only of the nature of belief, but of rationally indefensible belief — of an irrational faith).[99]
Карл Поппер указывает выход из этой апории[100] ясным рассуждением, из которого я хочу привести лишь два предложения, свидетельствующих, даже вне их контекста, о фундаментальном совпадении между результатами логики и исследования поведения. Поппер пишет: "Я считаю чрезвычайно важным различение между логической и психологической проблемой, вытекающее из трактовки Юмом той и другой. Но я полагаю, что его точка зрения неудовлетворительна в отношении того, что я назвал бы логикой. Он описывает, причем достаточно ясно, процессы
К методическим принципам Поппера принадлежит перевод всей субъективной терминологии в объективирующую во всех тех случаях, когда входят в рассмотрение
Логическое мышление, точно так же как образование условных реакций и бесчисленные иные «психологические» процессы, есть функция человеческого аппарата отображения мира, в целом находящегося в соответствии с условиями внесубъективной действительности, о чем уже неоднократно говорилось выше (с. 249). Горестное заключение Юмова эмпиризма, что все наше знание в действительности есть лишь совершенно неосновательная вера, было бы справедливо лишь в том случае, если бы было верно утверждение: "Nihil est in intellectu quod non antefuerat in sensu" (В нашем разуме нет ничего, чего не было раньше в нашем чувственном восприятии).
Но мы знаем уже, насколько ложно это утверждение, мы знаем, что любое явление приспособления есть когнитивный процесс и что данный нам a priori аппарат, с помощью которого только и возможно индивидуальное приобретение опыта, имеет уже своей предпосылкой огромную массу полученной в ходе эволюции и хранящейся в геноме информации. Этого Юм еще не знал, а бихевиористы не хотят этого знать.
В каждом из нас заложена установка, вынуждающая нас после повторного наступления некоторого события предполагать некоторую непонятную, трудно определимую
Гораздо легче ответить на вопрос, почему после многократного переживания некоторой
Но чисто случайные события, последовательность которых напоминала бы то, что происходит с колесом рулетки, в естественных условиях крайне редки. Напротив, цепи явлений, в которых
Реакция избегания у туфельки и комплексное центральное представление пространства у самых высших организмов — это приспособления к одной и той же реальной действительности, именно к непроницаемости тел и к их расположению в пространстве. Аналогичным образом образование условных реакций и причинное мышление — приспособления к одной и той же реальности, именно к сохранению и превращениям энергии.
Эмпиристы ошибаются, полагая, что причинное мышление человека возникает лишь вследствие привычки и что наше "propter hoc",[101] наше "потому что" якобы тождественно с часто переживавшимся и надежным "post hoc", "регулярно за этим". Аксиоматическая природа нашего причинного мышления вряд ли где-нибудь проявляется яснее, чем в предложениях, которыми Джеймс Прескотт Джоуль начинает свою классическую работу об эквиваленте тепла. Он говорит там, столь же наивно, как безапелляционно, что абсурдно предполагать, будто какая-нибудь форма энергии может исчезнуть, не превратившись в некоторую другую, постулируя тем самым то, что в конечном счете доказывает, а потому вовсе не имел бы надобности постулировать. Точно так же априорный характер причинного мышления проявляется у каждого умного ребенка в вечном вопросе "почему?".
Уже неоднократно говорилось, что функция более простых когнитивных аппаратов может контролироваться с точки зрения более сложных и что их сообщения при таком контроле никогда не оказываются ложными, а всегда лишь более бедными информацией, чем сообщения высших механизмов. Вполне очевидно, что такое же отношение существует между условной реакцией и причинным мышлением. Обучение посредством успеха, как и вообще любое образование ассоциаций, использует лишь одну из закономерностей превращения сил, состоящую в том, что причина предшествует во времени своему следствию. Этого достаточно, чтобы организм мог сделать жизненно важные приготовления.
7. МОТОРНОЕ ОБУЧЕНИЕ
Насколько мне известно, венский зоолог Отто Шторх первый ясно выразил тот важный факт, что адаптивная модификация поведения обнаруживается в рецепторном секторе поведения животного уже на гораздо более низком уровне развития, чем в моторном. За исключением очень простого процесса обучения, моторного прокладывания путей описанного в первом разделе предыдущей главы, все сказанное до сих пор о телеономном изменении поведения посредством обучения относится к рецепторным процессам, к тому, что Шторх называет "рецепторикой приобретения": сенситивизация, привыкание, приучение, травматическая ассоциация поведения бегства с определенными стимулирующими ситуациями, а также усиление избирательности врожденных механизмов запуска — все это процессы, основанные на изменениях рецепторных аппаратов.
В чем же состоят простейшие телеономные модификации
Соединение отдельных, уже имеющихся отрезков движений перемещения совершается в действительности вследствие того, что каждая условная реакция сцепляется с другой, ближайшей. Каждое движение производит
В точности этот вид обучения и именно эту форму сенсорного контроля выученного моторного процесса описал Альфред Кюн в своей ставшей классической книге "Ориентирование животных в пространстве" под именем мнемотаксиса и мнемической гомофонии; но он описал их лишь как теоретическую возможность. На это последовали возражения с разных сторон, что если бы эти допущения были верны, то животное вынуждено было бы всегда пробегать один и тот же однажды выученный путь и было бы дезориентировано, если бы хоть на шаг от него отступило. Поскольку Кюн не знал ни одного животного, удовлетворяющего этим требованиям, он опустил при переиздании своей книги главу о мнемотаксисе и мнемической гомофонии — и напрасно, потому что рассматриваемые здесь животные, как, например, водяная землеройка,[102] ведут себя в точности так, как требуется по его теории. Это производит особенно сильное впечатление, когда такое существо в самом деле сбивается с пути или когда в эксперименте нарочно нарушается гомофонное[103] совпадение между его твердо заученной последовательностью движений и обстоятельствами пути. Когда я удалял с пути моих землероек возвышавшееся препятствие, на которое они привыкли вспрыгивать и пробегать по нему дальше, то они в соответствующем месте подпрыгивали в пустой воздух, а затем, дезориентированные, сидели сначала на земле в том месте, где раньше находился исчезнувший предмет — небольшой деревянный ящичек. Потом они начинали исследовать местность волосками усиков, поворачивали назад и, как можно было заметить, узнавали уже пройденный до препятствия участок пути. Затем, с новым мужеством, они поворачивали, мчались в прежнем направлении — и снова подпрыгивали в пустоту в критическом месте! Они напоминали мне детей, которые, застряв при чтении наизусть стихотворения, начинают снова с какого-нибудь предыдущего места, чтобы пройти трудное место "с налету".
Можно с уверенностью допустить, что обучение более сложным целесообразным формам движения также происходит по только что описанным принципам. Хотя в случае путевых дрессировок речь идет почти исключительно о линейном сочленении отдельных элементов движения, происходящих от наследственных координации перемещения, не видно причин, почему бы интеграция одновременно протекающих частичных движений не могла осуществляться посредством подобных же процессов.
Многие авторы называли "знание наизусть" выученных последовательностей поведения «кинестетическим» знанием. Конечно, обратные сообщения проприоцепторов[104] играют важную роль в усвоении «заученного» движения (англ. "motor skill"), как показывает уже само греческое слово, составленное из κίυησις (движение) и ασθάνομαι (чувствую). Это выражение удачно также с феноменологической стороны, так как хорошо «заученная» форма движения в самом деле «чувствуется». Но, с другой стороны, этот термин вызывает представление, будто именно проприоцепторные образы наших воспоминаний дают нам возможность точно повторять такую последовательность движений, а это допущение вероятно, неверно. Как давно уже показал Эрих фон Гольст, произвольно составленные координации движений также подчиняются законам магнитного эффекта и центральной координации, что было в последнее время многократно подтверждено. Мы знаем из исследований Дж. Экклса, что орган, где осуществляется координация заученных движений, есть
Как мы еще покажем подробнее в разделе о произвольном движении, обучение движениям даже на самом высоком уровне в принципе не отличается от путевого обучения низших млекопитающих. В распоряжении животного всегда имеются врожденные формы движений с готовыми программами и центральной координацией, посредством обучения лишь интегрируемые в некоторое новое целое. По мере более высокого филетического[105] развития способности животных к обучению движения эти моторные элементы становятся все меньше. Но даже при подлинных произвольных движениях они все еще намного выше уровня интеграции фибриллярных[106] сокращений; более того, они, несомненно, охватывают в большинстве случаев еще сокращения нескольких синергических, т. е. действующих в одном направлении, мышц; но они все же достаточно малы, чтобы связываться в почти любые "мелодии движения" как при одновременном действии, так и во временной последовательности.
Об элементах движения, составляющих перемещения, мы знаем довольно достоверно, что в основе их лежат эндогенная[107] стимуляция и центральная координация. Я полагаю, что физиологические явления этого рода вообще не могут быть адаптивно изменены обучением или другими влияниями; меняться может лишь многообразие тех процессов, которые мы назвали выше (с. 295) мантией рефлексов, составляющих, налегая друг на друга, слой между этими явлениями и требованиями внешней среды. В пользу этого допущения говорит также то уже известное нам обстоятельство, что в случаях, когда посредническая функция мантии рефлексов оказывается недостаточной, лежащая в основе наследственная координация не просто «размягчается» и подчиняется таксисам, а распадается на малые куски, сами по себе столь же «твердые», как прыжок доброго коня, скачущего галопом, но как раз благодаря своей краткости более пригодные к легкому и многостороннему использованию в соответствии с пониманием пространства.
Несомненно, особое значение отработанного, «заученного» движения для сохранения вида состоит прежде всего в том, что оно
Никто еще не пытался применить к заученным, отработанным последовательностям движений животных те методы исследования, которые Эрих фон Гольст использовал в свое время, чтобы показать, что центрально координированные движения независимы от афферентных процессов. Конечно, предпринятая Эрихом фон Гольстом операция «дезафференции», выключение всех подводящих нервов, означает тяжелое общее повреждение организма, так что, если бы дезафференцированное животное не владело больше некоторым выученным до операции движением, это бы мало что доказало. У людей, болеющих Tabes dorsalis,[108] у которых вследствие болезни не функционируют окончания нервов, сообщающих о положении наших членов — так называемые проприоцепторы положения, — как известно, существенно нарушается координация движений. Но надо принять во внимание, что человек, в некотором роде, чемпион мира по усвоенным, сознательно управляемым произвольным движениям, и потому у него вполне могут афферентно контролироваться формы движения, эквиваленты которых у животных такого контроля не допускают.
Я не решаю вопроса, все ли выученные движения у животных и людей имеют одинаковую физиологическую природу; я говорю здесь лишь о том типе выработанных, отшлифованных тысячекратным повторением движений, о которых наш обиходный язык создал в своем естественном развитии такие выражения, как "знать что-нибудь наизусть", "вошло в плоть и кровь", "стало второй натурой" или, наконец, "совершенно автоматически". В отношении таких последовательностей движений я все же склонен допустить, что их физиологические механизмы те же, на которых основываются уже описанные путевые дрессировки мелких млекопитающих. Вопрос об этих механизмах представляет интерес по той причине, что соответствующие последовательности движений в ряде отношений поразительно напоминают наследственные координации, то есть инстинктивные движения.
Во-первых, координация выработанных движений, как показал уже Эрих фон Гольст, подчиняется ряду законов, совпадающих с законами центральной координации врожденных форм движения. Например, в обоих случаях ритмы различных включенных в общую координацию элементарных движений влияют друг на друга одинаковым образом. Явления "относительной координации" и "магнитного эффекта", по поводу которых я отсылаю к работам фон Гольста, осуществляют в буквальном смысле гармоническое созвучие отдельных ритмов, стремясь привести их в фазовое отношение, выражающееся в небольших целых числах. Чем совершеннее это получается, тем устойчивее координация ритмов. Формы движения, сопротивляющиеся описанным тенденциям процесса центральной координации, остаются неустойчивыми, т. е. их трудно сохранить, как знает каждый пианист, которому приходится играть одной рукой триоли, а другой — восьмые. Именно эти функции относительной координации и магнитного эффекта сообщают каждому хорошо усвоенному заученному движению, так же как независимому от процессов обучения инстинктивному движению, ту экономную и изящную форму, которая столь соответствует нашему чувству прекрасного.