Пусть каждое правило вида X
(14)
Таким образом, вторая строка (14) получается из первой подстановкой NP+VP вместо
(15)
Схема (15) несет меньше информации, чем деривация
(14) , поскольку она не показывает, в каком порядке применяются правила. Имея (14), мы можем построить (15) только одним способом, но не обратно, так как можно построить деривацию, сводящуюся к (15), но имеющую иной порядок применения правил. Схема (15) содержит именно то, что есть существенного в (14) для определения структуры непосредственно составляющих предложения- деривата The man hit the ball «Человек ударил мяч». Некоторая последовательность слов в этом предложении есть составляющая типа Z, если на схеме (15) мы можем возвести эту последовательность к некоторой одной точке, и эта точка обозначена Z. Так, hit the ball «ударил мяч» можно возвести к VP в (15); следовательно, в предложении-деривате hit the ball есть VP. Но man hit нельзя возвести ни к какой одной точке на схеме (15); значит, man hit — вообще не составляющая.
Мы называем две деривации эквивалентными, если они сводятся к одной и той же схеме типа (15). В некоторых случаях грамматика позволяет построить неэквивалентные деривации заданного предложения. В таких условиях можно говорить о «конструкционной омонимии»[14]. Если наша грамматика правильна, данное предложение должно быть двусмысленным. Ниже мы вернемся к этому важному понятию конструкционной омонимии.
Очевидна необходимость следующего обобщения системы (13). Мы должны иметь возможность ограничивать применение некоторого правила определенным контекстом. Так, вместо
(16) Z+X+W—>Z+Y+W
Например, в том случае, когда рассматривается единственное и множественное число глаголов, мы должны вместо того, чтобы добавлять к (13) правило Verb—>hits, добавить правило
(17)
показывающее, что
Теперь мы в состоянии дать более общее описание того типа грамматики, который связан с теорией лингвистической структуры, основанной на анализе по непосредственно составляющим. Всякая такая грамматика определяется конечным множеством Σ начальных цепочек и конечным множеством F «формул-команд» вида
4.2.
В § 3 мы рассмотрели языки, названные «языками с конечным числом состояний», которые порождаются посредством марковских процессов с конечным числом состояний. В настоящей главе мы рассматриваем терминальные языки, порождаемые системами вида [Σ,F]. Эти два типа языков связаны друг с другом следующим образом.
Теорема: Каждый язык с конечным числом состояний есть терминальный язык, но существуют терминальные языки, не являющиеся языками с конечным числом состояний[16]. Важно в этой теореме то, что описание в терминах модели непосредственно составляющих оказывается существенно более сильным, чем описание в терминах элементарной теории, рассмотренной выше в § 3. Примерами терминальных языков, не являющихся языками с конечным числом состояний, могут служить языки (10 I) и (10 II), рассмотренные в § 3. Так, язык (10 I), состоящий из всех цепочек вида ab, aabb, aaabbb,.. и только этого вида, может порождаться [Σ,F]-грамма- тикой (18):
(18) Σ:
F:
Эта грамматика имеет начальную цепочку
В § 3 мы указали, что языки (10 I) и (10 II) соответствуют определенным частям английского языка и что поэтому модель марковского процесса с конечным числом состояний не адекватна английскому языку. Мы убедились теперь, что модель непосредственно составляющих не оказывается несостоятельной в таких случаях. Мы не доказали адекватности этой модели, но нам удалось показать, что значительные части английского языка, которые в буквальном смысле не могут быть описаны в терминах модели с конечным числом состояний, описываются в терминах модели непосредственно составляющих.
Можно сказать, что в случае (18) в цепочке
Заметим также, что в случае (13) и (18) (как вообще в случае любой системы непосредственно составляющих) всякая терминальная цепочка имеет несколько представлений. Так, например, в случае (13) терминальная цепочка The man hit the ball «Человек ударил мяч» представляется цепочками Sentence,
4.3.
Допустим, что с помощью [Σ,F]-грамматики мы можем порождать все грамматически правильные последовательности морфем какого-то языка. Для завершения грамматики мы должны установить фонемную структуру этих морфем, с тем чтобы грамматика производила грамматически правильные последовательности фонем данного языка. Но и эта часть грамматики (которую мы назовем морфофонемикой языка) также может быть задана в виде набора правил типа «подставить
(19) (I)
(И)
(III)
(IV) /
(V) /
(VI)
(VII)
или чего-либо в этом роде. Заметим, в частности, что между этими правилами должна быть установлена очередность. Так, правило (II) должно предшествовать правилу (V) или правилу (VII), иначе мы получим такие формы, как
Теперь мы можем прибавить к деривациям модели непосредственно составляющих систему (19); в результате мы получим единый процесс порождения последовательностей фонем из начальной цепочки Sentence. Это может создать впечатление, что граница между уровнем непосредственно составляющих и более низкими уровнями произвольна. В действительности это не так. Во-первых, как мы видели, формальные свойства правил X
Ниже мы увидим, что существует более глубокое основание для того, чтобы различать правила модели непосредственно составляющих, носящие характер более высокого уровня, и правила, носящие характер более низкого уровня, превращающие цепочки морфем в цепочки фонем.
Формальные свойства модели непосредственно составляющих представляют предмет интересного исследования, и легко доказать, что дальнейшая разработка этого типа грамматики необходима и возможна. Нетрудно обнаружить, что весьма выгодно расположить правила множества F так, чтобы некоторые из правил могли применяться только после того, как другие правила уже были применены. Например, определенно необходимо, чтобы правила типа (17) применялись раньше любого правила, позволяющего нам подставить
5. ОГРАНИЧЕННОСТЬ ОПИСАНИЯ ПО НЕПОСРЕДСТВЕННО СОСТАВЛЯЮЩИМ
5.1.
Мы рассмотрели две модели структуры языка: теоретико-коммуникационную модель, основанную на представлении о языке как о марковском процессе, являющуюся в некотором смысле минимальной лингвистической теорией, и модель, основанную на анализе по непосредственно составляющим. Мы убедились, что первая из них, безусловно, не адекватна задачам грамматики и что вторая является более сильной, чем первая, оставаясь пригодной в тех случаях, когда первая оказывается несостоятельной. Вместе с тем существуют, разумеется, языки, которые не могут быть описаны в терминах модели непосредственно составляющих ((10 III) — один из них). Я не знаю, является ли английский язык таким языком, который в буквальном смысле находится вне сферы компетенции анализа подобного рода. Я думаю, однако, что существуют другие основания для того, чтобы отклонить теорию анализа по непосредственно составляющим как не адекватную целям лингвистического описания.
Самое сильное из возможных доказательств неадекватности лингвистической теории состоит в том, чтобы показать, что она вообще не может быть применена к некоторому естественному языку. Более слабым, но вполне достаточным доказательством было бы показать, что эту теорию можно применить лишь громоздким, неизящным способом; другими словами — показать, что любая грамматика, которую можно построить на основе этой теории, будет чрезвычайно сложной, эмпиричной, ad hoc, и не «наглядной», что некоторые весьма простые способы описания грамматически правильных предложений не могут быть формализованы в терминах грамматики и что некоторые фундаментальные формальные свойства естественного языка нельзя использовать для упрощения грамматик. Мы в состоянии привести большое число свидетельств подобного рода в пользу того положения, что описанный выше тип грамматики, а также лежащая в его основе лингвистическая теория принципиально неадекватны.
Единственный способ проверить адекватность данного механизма — попытаться применить его непосредственно для описания английских предложений. Как только мы рассмотрим предложения, выходящие за пределы простейшего типа, и в особенности попытаемся установить какую-то очередность среди правил, порождающих эти предложения, мы натолкнемся на многочисленные сложности изатруднения. Обоснование этого утверждения потребовало бы много труда и места, и здесь я могу лишь заявить, что его можно подтвердить весьма убедительно[18]. Вместо того чтобы следовать здесь этому довольно трудному и рискованному курсу, я ограничусь кратким рассмотрением кескольких простых случаев, в которые оказывается возможным значительное упрощение описаний по сравнению с грамматиками типа [Σ,F]. В § 8 я предложу другой, независимый способ доказательства непригодности анализа по непосредственно составляющим для описания структуры английского предложения.
5.2.
Одним из наиболее продуктивных способов образования новых предложений является процесс сочинения. Если имеется два предложения
(20) (a)
«Эта сцена—фильма—происходила в Чикаго»
(b)
«Эта сцена—пьесы— происходила в Чикаго»
(21)
«Эта сцена—фильма и пьесы—происходила в Чикаго».
Если же X и Y не являются составляющими, мы, вообще говоря, не сможем этого сделать[19] Например, нельзя получить (23) из (22 а—b).
(22) (a) The — liner sailed down the — river
«Этот — пароход спускался по — реке»
(b) The — tugboat chugged up the — river «Этот — буксир подымался по — реке»
(23) The — liner sailed down the and tugboat chugged up the — river
«Этот — пароход спускался по и буксир подымался по — реке».
Подобным же образом, если
(24) (a) The scene—-of the movie — was in Chicago
„Эта сцена — фильма — происходила в Чикаго"
(b) The scene — that I wrote — was in Chicago
„(Эта) сцена — которую я написал — происходила в Чикаго"
(25) The scene — of the movie and that I wrote — was in Chicago
„Эта сцена—фильма и которую я написал — происходила в Чикаго".
Фактически возможность сочинения представляет собой один из лучших критериев правильности первоначального определения структуры составляющих. Можно упростить описание сочинения, если дать такое определение составляющих, при котором выполнялось бы следующее правило:
(26) Если
Хотя это правило требует дополнительных уточнений, грамматика сильно упрощается, если определять составляющие так, чтобы (26) выполнялось, пусть даже приблизительно. Другими словами, легче установить дистрибуцию союза and путем уточнения этого правила, чем сделать это непосредственно, без помощи такого правила. Теперь, однако, перед нами возникает следующая трудность: мы не можем включить правило (26) или что-либо ему подобное в грамматику типа [Σ,F] в силу некоторых фундаментальных ограничений, наложенных на такие грамматики. Существенное свойство правила (26) состоит в том, что для примейения его к предложениям S1 и S2 с целью образования предложения S3 необходимо знать не только наличный вид Sl и S2, но и структуру их составляющих, т. е. нам должна быть известна не только окончательная форма этих предложений, но также их «деривационная история». Каждое же из правил
Изложим это несколько иначе. Грамматику [Σ,F] можно рассматривать как некоторый весьма элементарный процесс, порождающий предложения не «слева направо», а «сверху вниз». Пусть имеется следующая грамматика непосредственно составляющих: