Введение понятия структуры составляющих оправдывается не только возможностью справиться с его помощью с неоднозначностями, подобными только что рассмотренным. Главное основание считать предложения состоящими из «слоев» составляющих заключается в том, что таким образом можно достичь более экономного и интуитивно более удовлетворительного описания. Это будет ясно из последующего. Мимоходом можно упомянуть о существовании других видов неоднозначности, которые могут быть описаны с помощью грамматической структуры существенно иного рода, нежели рассматриваемая нами в настоящее время. Некоторые из них обсуждаются ниже в этой главе (см. § 6.6.2).
6.2. ГРАММАТИКИ СТРУКТУРЫ НЕПОСРЕДСТВЕННЫХ СОСТАВЛЯЮЩИХ [40] *
6.2.1. СТРУКТУРЫ НЕПОСРЕДСТВЕННЫХ СОСТАВЛЯЮЩИХ
Одно дело знать, где поставить скобки в некотором данном предложении, совсем иную проблему составляет построение системы генеративных правил такого рода, чтобы они эксплицитным образом приписывали предложениям правильную структуру составляющих. Хотя можно представить себе много различных систем грамматических правил, которые бы предлагали для всех порождаемых ими предложений анализ структуры составляющих, мы ограничимся сначала рассмотрением конкатенирующих систем подстановки, подобных тем, с которыми нас познакомил Хомский. Такие системы мы будем называть грамматиками структуры непосредственных составляющих. Таким образом, термин «грамматики структуры составляющих» будет иметь более широкий смысл.
6.2.2. СИСТЕМЫ ПОДСТАНОВКИ
Мы можем вначале задать серию правил подстановки (предполагается, что они являются конкатенирующими; ср. §6.6.1) следующего вида:
(1) Σ → NP + VP
(2) VP → V + Adv
(3) NP → A + N.
Каждое из этих правил (за исключением первого) применяется одно за другим к выходу предыдущего правила — так что при подстановке (или «переписывании») ко всякому символу, стоящему в левой части правила, добавляются заключенные в скобки символы, стоящие после стрелки. Тогда выходом правила (1) будет:
Σ (NP + VP),
посредством применения к нему правила (2) получится:
Σ {NP + VP (V + Adv)}
и, наконец, применяя правило (3), мы получим:
Σ {NP (A + N) + VP (V + Adv)}.
Иначе говоря, каждое правило заключает в одни скобки составляющие, которые образуют определяемую им конструкцию, и, помечая скобки, дает название конструкции; при этом порядок применения правил определяет структурные слои. В данном случае результат бы не изменился, если бы правило (3) применялось до правила (2). Но правило (1) должно применяться первым, чтобы получились элементы, требуемые для применения правил (2) и (3). Элемент, стоящий в левой части правила (1) данной грамматики, обозначает конструкцию самого высокого уровня, составляющими которой являются все остальные конструкции, порождаемые грамматикой. Мы будем называть этот элемент («предложение») начальным символом. После применения всех правил, имеющих отношение к порождению определенного типа предложения, грамматика «произведет» «цепочку» заключенных в скобки символов (прилагательное, существительное, глагол и т. д.), каждый из которых обозначает некоторый класс элементов лексикона. Символы, обозначающие лексические классы, мы будем называть терминальными символами, а цепочки заключенных в скобки терминальных символов — терминальными цепочками. Если теперь заменить каждый из терминальных символов в терминальной цепочке каким-либо членом обозначаемого им лексического класса, мы получим предложение, структура составляющих которого целиком определена правилами, порождающими эту терминальную цепочку. Так, при условии, что словарь содержит следующую информацию (ср. § 4.1.3 и сл.):
N = {John, и т. д.}
V = {ran, и т. д.}
А = {poor, и т. д.}
Adv = {away, и т. д.},
приведенная выше грамматика из трех правил будет порождать такие предложения, как Poor John ran away, вместе с их правильной структурой составляющих. Наоборот, имея данное предложение и используя лексикон, организованный более удобным для анализа образом, то есть приблизительно в такой форме, как
away : Adv
John : N
poor : A
ran : V,
мы сможем заменить каждое слово этого предложения символом его класса и затем последовательно обработать его правилами грамматики, пройдя по ним снизу вверх и Справа налево до тех пор, пока, благополучно дойдя до начального символа правила (1), мы тем самым не признаем предложение грамматически приемлемым и обладающим определенной структурой составляющих. Следует подчеркнуть, что возможность выбирать направление последовательного действия правил связана с тем, что данная грамматика удовлетворяет некоторым общим условиям (которые мы здесь не будем рассматривать; ср. § 6.2.11). Независимо от этой частной особенности она нейтральна относительно анализа и синтеза (см. § 4.3.1), и она формализует понятие «размеченной скобочной записи» (см. § 6.1.3).
6.2.3. АЛЬТЕРНАТИВНЫЕ ПРАВИЛА
Теперь расширим эту грамматику так, чтобы сделать ее способной «производить» и «распознавать» не только такие предложения, как Poor John ran away, но и предложения типа Old men love young women 'Старые мужчины любят молодых женщин'. Мы можем сделать это путем введения правил, предусматривающих альтернативные способы «замены» элемента VP (глагольная группа). Таким образом:
(1) Σ → NP + VP
(2а) VP → Vintr + Adv
(2b) VP → Vtr + NP
(3) NP → A + N.
Имеется в виду, что одно из подправил — (2а) или (2b) — должно быть применено обязательно, но выбор между ними произволен. Введя в грамматику возможность выбирать между (2а) и (2b), мы должны также изменить классификацию слов в лексиконе:
Vintr = {ran, и т. д.}
Vtr = {love 'любить', kill 'убить, убивать', и т. д.}.
Тем не менее в целом ряде отношений наша грамматика продолжает оставаться не вполне удовлетворительной. Прежде всего, можно заметить, что, хотя она правильно порождает те предложения, которые мы использовали выше, она также порождает такие неприемлемые «предложения», как *Poor John kill old women [41]. В какой-то момент мы должны будем учесть существующее в английском языке «согласование» между «подлежащим» предложения и глаголом (если глагол стоит в «настоящем времени»). Временно мы оставим этот вопрос в стороне (см. § 6.5.4). Вторым недостатком грамматики является то, что, если каждое из правил применяется всюду, где оно применимо, как мы до сих пор полагали, грамматика будет неизбежно порождать либо предложения из пяти слов типа Old men love young women 'Старые мужчины любят молодых женщин', либо предложения из четырех слов типа Poor John ran away 'Бедный Джон убежал прочь'. Она не породит John ran away 'Джон убежал прочь', John ran 'Джон побежал', Men love young women 'Мужчины любят молодых женщин', Old men love women 'Старые мужчины любят женщин' и т. п. И она не породит, скажем, Old men love young women passionately 'Старые мужчины страстно любят молодых женщин'.
6.2.4. ФАКУЛЬТАТИВНЫЕ И ОБЯЗАТЕЛЬНЫЕ ПРАВИЛА
Разобьем теперь правило (3) на два правила, а именно:
(3) NP → N
(4) N → А + N,
указав, что правило (3) является обязательным, тогда как правило (4) факультативно. Теперь грамматика породит John ran away, Men love women, Old men love women, Men love young women и т. д.
Рассмотрим теперь деревья (приведенные на рис. 10), представляющие предложения, которые порождаются правилами, установленными до сих пор, как, например: (i) John ran away, (ii) Poor John ran away, (iii) Men love women, (iv) Old men love women, (v) Men love young women, (vi) Old men love young women.
Рис. 10. (Отметим, что ветвь для NP → P пропущена в (v) и (vi).)
Обратившись к деревьям или правилам, посредством которых строятся эти предложения, можно видеть, что все рассматриваемые предложения являются подтипами предложения типа Σ (NP + VP). Другими словами, на некотором уровне анализа они структурно тождественны. На более низком уровне (i) и (ii) тождественны друг с другом, но отличны по структуре от (iii) — (iv) и т. д. Введение факультативных и альтернативных правил, таким образом, увеличивает «силу» грамматики, а также группирует однотипные конструкции в соответствующие подтипы.
6.2.5. УПОРЯДОЧЕНИЕ ПРАВИЛ
Все, что было сказано до сих пор, предполагало применение правил грамматики (там, где они применимы) в порядке, соответствующем их номерам. Мы должны рассмотреть этот вопрос подробнее, так как требование того, а не иного порядка применения правил может существенно повлиять на выход грамматики. Рассмотрим следующую систему правил, которая совпадает с приведенной выше, за исключением того, что добавлено новое праеило (4) (правила (4) и (5) представляют собой факультативные правила)'