E-LIT (Э-Лит) Читать Синтаксические структуры

Читать: Синтаксические структуры - Ноам Хомский на бесплатной онлайн библиотеке Э-Лит

Помоги проекту - поделись книгой:

Пусть каждое правило вида X—>Y системы (13) означает предписание: «вместо X подставить К». Систему (14) мы можем назвать деривацией предложения The man hit the ball «Человек ударил мяч». Номер справа от Каждой строки деривации показывает, какое правило «грамматики» (13) используется для получения данной строки из предыдущей[13].

(14) Sentence

NP+VP (I)

T+N+VP (II)

T+N+Verb+NP (III)

the+N+Verb+NP (IV)

the+man+Verb+NP (V)

the+man+hit+NP (VI)

the+man+hit+T+N (II)

the+man+hit+the+N (IV)

the+man+hit+the+ball (V)

Таким образом, вторая строка (14) получается из первой подстановкой NP+VP вместо Sentence по правилу (1) системы (13); третья строка получается из второй подстановкой T+N вместо NP по правилу (II) и т. д. Мы можем наглядным образом представить деривацию (14) с помощью следующей схемы:

(15)

Схема (15) несет меньше информации, чем деривация

(14) , поскольку она не показывает, в каком порядке применяются правила. Имея (14), мы можем построить (15) только одним способом, но не обратно, так как можно построить деривацию, сводящуюся к (15), но имеющую иной порядок применения правил. Схема (15) содержит именно то, что есть существенного в (14) для определения структуры непосредственно составляющих предложения- деривата The man hit the ball «Человек ударил мяч». Некоторая последовательность слов в этом предложении есть составляющая типа Z, если на схеме (15) мы можем возвести эту последовательность к некоторой одной точке, и эта точка обозначена Z. Так, hit the ball «ударил мяч» можно возвести к VP в (15); следовательно, в предложении-деривате hit the ball есть VP. Но man hit нельзя возвести ни к какой одной точке на схеме (15); значит, man hit — вообще не составляющая.

Мы называем две деривации эквивалентными, если они сводятся к одной и той же схеме типа (15). В некоторых случаях грамматика позволяет построить неэквивалентные деривации заданного предложения. В таких условиях можно говорить о «конструкционной омонимии»[14]. Если наша грамматика правильна, данное предложение должно быть двусмысленным. Ниже мы вернемся к этому важному понятию конструкционной омонимии.

Очевидна необходимость следующего обобщения системы (13). Мы должны иметь возможность ограничивать применение некоторого правила определенным контекстом. Так, вместо Т можно подставить а, если следующее существительное стоит в единственном числе, но не во множественном; точно так же вместо Verb можно подставить hits, если ему предшествует существительное man, но нельзя — если ему предшествует men. Вообще, если мы хотим ограничить подстановку Y вместо X контекстом Z—>W, мы можем задать в грамматике правило

(16) Z+X+W—>Z+Y+W

Например, в том случае, когда рассматривается единственное и множественное число глаголов, мы должны вместо того, чтобы добавлять к (13) правило Verb—>hits, добавить правило

(17) NP_sing+Verb —> Np_sing+hits.

показывающее, что hits подставляется на место Verb только в контексте NP_sing—. Соответственно, правило (13 II) должно быть сформулировано так, чтобы можно было учесть NP_sing и NP_pl[15]. Это прямое обобщение правила (13). Одна черта системы (13) должна быть сохранена, однако, как это имеет место в (17): при применении одного правила только один элемент может подвергаться подстановке; другими словами, в (16) X должен представлять собой один символ, например Т или Verb, а не последовательность символов, как, скажем, T+N. Если это условие не соблюдено, мы не можем надлежащим образом восстановить структуру непосредственно составляющих предложений-дериватов по соответствующим схемам вида (15) , как мы делали выше.

Теперь мы в состоянии дать более общее описание того типа грамматики, который связан с теорией лингвистической структуры, основанной на анализе по непосредственно составляющим. Всякая такая грамматика определяется конечным множеством Σ начальных цепочек и конечным множеством F «формул-команд» вида X—>Y, означающих: «подставить Y вместо X». Хотя X не обязательно должно быть одним символом, только один символ из состава X может быть заменен при образовании Y. В грамматике (13) множество Σ начальных цепочек состоит из единственного символа Sentence, a F состоит из правил (I) —(VI); но мы можем потребовать расширения множества Σ, с тем чтобы оно включало, например, Declarative Sentence, Interrogative Sentence в качестве дополнительных символов. Обладая грамматикой [Σ,F], мы определяем деривацию как конечную последовательность цепочек, начинающуюся с одной из начальных цепочек Σ, такую, что каждая цепочка в ней получается из предыдущей цепочки в результате применения одной из формул-команд множества F. Так, (14) есть деривация; пятичленная последовательность цепочек, состоящая из первых пяти строк (14),также есть деривация. Некоторые деривации являются завершенными в том смысле, что нет такого правила в F, с помощью которого можно было бы преобразовать их последнюю цепочку. Так, (14) — завершенная деривация, а последовательность первых пяти строк (14) — незавершенная. Если какая-то цепочка является последней цепочкой завершенной деривации, мы называем ее терминальной.Так, the+man+hit+the+ball есть терминальная цепочка грамматики (13). Некоторые грамматики типа [Σ,F] могут не иметь терминальных цепочек, но мы интересуемся только теми грамматиками, которые их имеют, то есть описывающими некоторые языки. Множество цепочек называется терминальным языком, если это множество является множеством терминальных цепочек некоторой грамматики [Σ,F]. Таким образом, каждая такая грамматика определяет некоторый терминальный язык (в частности, «пустой» язык, не содержащий ни одного предложения), и каждый терминальный язык порождается некоторой грамматикой типа [Σ,F], Имея терминальный язык и его грамматику, мы можем реконструировать структуру непосредственно составляющих каждого предложения этого языка (каждой терминальной цепочки грамматики), рассматривая соответствующие схемы типа (15), как мы делали это выше. Мы можем также определить грамматические отношения в этих языках формальным образом в терминах соответствующих схем.

4.2.

В § 3 мы рассмотрели языки, названные «языками с конечным числом состояний», которые порождаются посредством марковских процессов с конечным числом состояний. В настоящей главе мы рассматриваем терминальные языки, порождаемые системами вида [Σ,F]. Эти два типа языков связаны друг с другом следующим образом.

Теорема: Каждый язык с конечным числом состояний есть терминальный язык, но существуют терминальные языки, не являющиеся языками с конечным числом состояний[16]. Важно в этой теореме то, что описание в терминах модели непосредственно составляющих оказывается существенно более сильным, чем описание в терминах элементарной теории, рассмотренной выше в § 3. Примерами терминальных языков, не являющихся языками с конечным числом состояний, могут служить языки (10 I) и (10 II), рассмотренные в § 3. Так, язык (10 I), состоящий из всех цепочек вида ab, aabb, aaabbb,.. и только этого вида, может порождаться [Σ,F]-грамма- тикой (18):

(18) Σ: Z

F: Z—>ab

Z—>aZb

Эта грамматика имеет начальную цепочку Z [как,(13) имеет в качестве начальной цепочки символ Sentence] и два правила. Нетрудно заметить, что каждая завершенная деривация, построенная согласно (18), оканчивается цепочкой языка (10 I) и что этим способом порождаются все такие цепочки. Подобным образом языки вида (10 II) также могут порождаться [Σ,F]-грамматиками. Язык (10 III), однако, не может порождаться грамматикой этого типа.

В § 3 мы указали, что языки (10 I) и (10 II) соответствуют определенным частям английского языка и что поэтому модель марковского процесса с конечным числом состояний не адекватна английскому языку. Мы убедились теперь, что модель непосредственно составляющих не оказывается несостоятельной в таких случаях. Мы не доказали адекватности этой модели, но нам удалось показать, что значительные части английского языка, которые в буквальном смысле не могут быть описаны в терминах модели с конечным числом состояний, описываются в терминах модели непосредственно составляющих.

Можно сказать, что в случае (18) в цепочке aaabbb языка (10 I) ab, например, есть Z, aabb есть Z и aaabbb само есть Z[17]. Таким образом, эта конкретная цепочка содержит три группы, каждая из которых есть Z. Это, разумеется, весьма тривиальный язык. Важно отметить, что при описании данного языка мы ввели символ Z, который не содержится в предложениях указанного языка. Это существенная черта модели непосредственно составляющих, обусловливающая ее «абстрактный» характер.

Заметим также, что в случае (13) и (18) (как вообще в случае любой системы непосредственно составляющих) всякая терминальная цепочка имеет несколько представлений. Так, например, в случае (13) терминальная цепочка The man hit the ball «Человек ударил мяч» представляется цепочками Sentence, NP+VP, T+N+VP и вообще любой из строк системы (14), равно как и цепочками типа NP+Verb+NP, T+N+hit+NP, которые могут выступать в деривациях, эквивалентных (14) в определенном выше смысле. На уровне непосредственно составляющих, следовательно, каждое предложение определенного языка представляется множеством цепочек, а не одной цепочкой, как это имеет место на уровнях фонем, морфем или слов. Таким образом, структура непосредственно составляющих, рассматриваемая как лингвистический уровень, имеет радикально иной и нетривиальный характер, что, как мы видели в § 3.3, необходимо для некоторых лингвистических уровней. Мы не можем установить иерархию среди различных представлений предложения The man hit the ball «Человек ударил мяч»; мы не можем разбить систему непосредственно составляющих на конечное множество уровней, упорядоченных от верхнего до нижнего так, чтобы каждое предложение имело одно представление на каждом из этих подуровней. Например, нет способа установить очередность по вертикали для элементов NP и VP. В английском языке именная группа может содержаться в глагольной, а глагольная — в именной. Структура непосредственно составляющих должна рассматриваться как единый уровень с множеством представлений для каждого предложения языка. Существует взаимно однозначное соответствие между правильно выбранными множествами представлений и схемами типа (15).

4.3.

Допустим, что с помощью [Σ,F]-грамматики мы можем порождать все грамматически правильные последовательности морфем какого-то языка. Для завершения грамматики мы должны установить фонемную структуру этих морфем, с тем чтобы грамматика производила грамматически правильные последовательности фонем данного языка. Но и эта часть грамматики (которую мы назовем морфофонемикой языка) также может быть задана в виде набора правил типа «подставить Y вместо X», то есть, для английского языка, в виде системы

(19) (I) walk—>/wok/

(И) take+past—>/tuk/

(III) hit+past—>/hit/

(IV) /...D/+past—>/...D/+/id/ (где D=/t/ или /d/)

(V) /...C_unv/+past—>/...C_unv/+/t/ (где C_unv — глухая согласная)

(VI) past—>/d/

(VII) take—>/teyk/ и т. д.

или чего-либо в этом роде. Заметим, в частности, что между этими правилами должна быть установлена очередность. Так, правило (II) должно предшествовать правилу (V) или правилу (VII), иначе мы получим такие формы, как /teykt/ для прошедшего времени от глагола take «брать». Для этих морфофонемных правил уже не является обязательным требование, чтобы в результате применения каждого правила заменялся только один символ.

Теперь мы можем прибавить к деривациям модели непосредственно составляющих систему (19); в результате мы получим единый процесс порождения последовательностей фонем из начальной цепочки Sentence. Это может создать впечатление, что граница между уровнем непосредственно составляющих и более низкими уровнями произвольна. В действительности это не так. Во-первых, как мы видели, формальные свойства правил X—>Y, относящихся к модели непосредственно составляющих, отличаются от свойств правил морфофонемики, поскольку в первом случае мы должны требовать, чтобы заменялся только один символ. Во-вторых, элементы, фигурирующие в правилах (19), могут быть разбиты на конечное число уровней (например, фонемы и морфемы; или, может быть, фонемы, морфофонемы и морфемы), каждый из которых является элементарным в том смысле, что лишь единственная цепочка элементов этого уровня служит представлением для каждого предложения на данном уровне (если исключить случаи омонимии) и что каждая такая цепочка представляет лишь одно предложение. Элементы же, появляющиеся в правилах, относящихся к модели непосредственно составляющих, не могут быть разбиты на более высокие и более низкие уровни указанным способом.

Ниже мы увидим, что существует более глубокое основание для того, чтобы различать правила модели непосредственно составляющих, носящие характер более высокого уровня, и правила, носящие характер более низкого уровня, превращающие цепочки морфем в цепочки фонем.

Формальные свойства модели непосредственно составляющих представляют предмет интересного исследования, и легко доказать, что дальнейшая разработка этого типа грамматики необходима и возможна. Нетрудно обнаружить, что весьма выгодно расположить правила множества F так, чтобы некоторые из правил могли применяться только после того, как другие правила уже были применены. Например, определенно необходимо, чтобы правила типа (17) применялись раньше любого правила, позволяющего нам подставить NP+Preposition+NP вместо NP и т. п.; в противном случае грамматика будет порождать такие непредложения, как The men near the truck begins work at eight. Однако такая разработка связана с проблемами, уводящими нас за рамки этого исследования.

5. ОГРАНИЧЕННОСТЬ ОПИСАНИЯ ПО НЕПОСРЕДСТВЕННО СОСТАВЛЯЮЩИМ

5.1.

Мы рассмотрели две модели структуры языка: теоретико-коммуникационную модель, основанную на представлении о языке как о марковском процессе, являющуюся в некотором смысле минимальной лингвистической теорией, и модель, основанную на анализе по непосредственно составляющим. Мы убедились, что первая из них, безусловно, не адекватна задачам грамматики и что вторая является более сильной, чем первая, оставаясь пригодной в тех случаях, когда первая оказывается несостоятельной. Вместе с тем существуют, разумеется, языки, которые не могут быть описаны в терминах модели непосредственно составляющих ((10 III) — один из них). Я не знаю, является ли английский язык таким языком, который в буквальном смысле находится вне сферы компетенции анализа подобного рода. Я думаю, однако, что существуют другие основания для того, чтобы отклонить теорию анализа по непосредственно составляющим как не адекватную целям лингвистического описания.

Самое сильное из возможных доказательств неадекватности лингвистической теории состоит в том, чтобы показать, что она вообще не может быть применена к некоторому естественному языку. Более слабым, но вполне достаточным доказательством было бы показать, что эту теорию можно применить лишь громоздким, неизящным способом; другими словами — показать, что любая грамматика, которую можно построить на основе этой теории, будет чрезвычайно сложной, эмпиричной, ad hoc, и не «наглядной», что некоторые весьма простые способы описания грамматически правильных предложений не могут быть формализованы в терминах грамматики и что некоторые фундаментальные формальные свойства естественного языка нельзя использовать для упрощения грамматик. Мы в состоянии привести большое число свидетельств подобного рода в пользу того положения, что описанный выше тип грамматики, а также лежащая в его основе лингвистическая теория принципиально неадекватны.

Единственный способ проверить адекватность данного механизма — попытаться применить его непосредственно для описания английских предложений. Как только мы рассмотрим предложения, выходящие за пределы простейшего типа, и в особенности попытаемся установить какую-то очередность среди правил, порождающих эти предложения, мы натолкнемся на многочисленные сложности изатруднения. Обоснование этого утверждения потребовало бы много труда и места, и здесь я могу лишь заявить, что его можно подтвердить весьма убедительно[18]. Вместо того чтобы следовать здесь этому довольно трудному и рискованному курсу, я ограничусь кратким рассмотрением кескольких простых случаев, в которые оказывается возможным значительное упрощение описаний по сравнению с грамматиками типа [Σ,F]. В § 8 я предложу другой, независимый способ доказательства непригодности анализа по непосредственно составляющим для описания структуры английского предложения.

5.2.

Одним из наиболее продуктивных способов образования новых предложений является процесс сочинения. Если имеется два предложения Z+X+W и Z+Y+W, примем X и Y являются действительно составляющими этих предложений, мы можем в общем случае образовать новое предложение Z—X+and+Y—W. Например, из предложений (20a—b) можно получить новое предложение (21):

(20) (a) The scene —of the movie—was in Chicago

«Эта сцена—фильма—происходила в Чикаго»

(b) The scene—of the play—was in Chicago

«Эта сцена—пьесы— происходила в Чикаго»

(21) The scene—of the movie and of the play—was in Chicago.

«Эта сцена—фильма и пьесы—происходила в Чикаго».

Если же X и Y не являются составляющими, мы, вообще говоря, не сможем этого сделать[19] Например, нельзя получить (23) из (22 а—b).

(22) (a) The — liner sailed down the — river

«Этот — пароход спускался по — реке»

(b) The — tugboat chugged up the — river «Этот — буксир подымался по — реке»

(23) The — liner sailed down the and tugboat chugged up the — river

«Этот — пароход спускался по и буксир подымался по — реке».

Подобным же образом, если X и Y — оба суть составляющие, но разного рода (т. е. на схеме типа (15) каждая из них имеет одну исходную точку, но эти точки обозначены разными символами), то мы не можем в общем случае образовать новое предложение посредством сочинения. Например, нельзя образовать (25) из (24a—b).

(24) (a) The scene—-of the movie — was in Chicago

„Эта сцена — фильма — происходила в Чикаго"

(b) The scene — that I wrote — was in Chicago

„(Эта) сцена — которую я написал — происходила в Чикаго"

(25) The scene — of the movie and that I wrote — was in Chicago

„Эта сцена—фильма и которую я написал — происходила в Чикаго".

Фактически возможность сочинения представляет собой один из лучших критериев правильности первоначального определения структуры составляющих. Можно упростить описание сочинения, если дать такое определение составляющих, при котором выполнялось бы следующее правило:

(26) Если S₁ и S₂ — грамматически правильные предложения и S₁ отличается от S₂ только тем, что Y появляется в S₂ на том месте, где X находится в S_l (т. е. S₁= ...X... и S₂=...Y...; причем X и Y — суть составляющие одного типа, соответственно в S₁ и S₂), то S₃ есть поедложение; здесь S₃ — результат подстановки X+and+Y вместо X в S₁ (т. е. S₃=...X+and+Y...).

Хотя это правило требует дополнительных уточнений, грамматика сильно упрощается, если определять составляющие так, чтобы (26) выполнялось, пусть даже приблизительно. Другими словами, легче установить дистрибуцию союза and путем уточнения этого правила, чем сделать это непосредственно, без помощи такого правила. Теперь, однако, перед нами возникает следующая трудность: мы не можем включить правило (26) или что-либо ему подобное в грамматику типа [Σ,F] в силу некоторых фундаментальных ограничений, наложенных на такие грамматики. Существенное свойство правила (26) состоит в том, что для примейения его к предложениям S₁ и S₂ с целью образования предложения S₃ необходимо знать не только наличный вид S_l и S₂, но и структуру их составляющих, т. е. нам должна быть известна не только окончательная форма этих предложений, но также их «деривационная история». Каждое же из правил X—>Y грамматики [Σ,F] применимо или не применимо к заданной цепочке только в зависимости от состояния этой цепочки. Каким образом цепочка постепенно получила данный вид— не существенно. Если цепочка содержит X в качестве элемента, правило X—>Y к ней применить можно; если нет, правило не применимо.

Изложим это несколько иначе. Грамматику [Σ,F] можно рассматривать как некоторый весьма элементарный процесс, порождающий предложения не «слева направо», а «сверху вниз». Пусть имеется следующая грамматика непосредственно составляющих:

Предыдущая глава

Следующая глава

Поделиться книгой:

Читать, слущать книги онлайн бесплатно!

Электронная Литература.

Бесплатная онлайн библиотека.