6.4.3. ЭНДОЦЕНТРИЧНОСТЬ В ГРАММАТИКЕ СТРУКТУРЫ НЕПОСРЕДСТВЕННЫХ СОСТАВЛЯЮЩИХ
Дистрибуционная основа правил «подстановочной» грамматики структуры составляющих достаточно ясна. Каждое правило вида А → В + С основано на дистрибуционном тождестве А и В + С; точнее, на включении дистрибуции В + С в дистрибуцию А (тождество является частным случаем включения). Различие между тождеством и включением (или, в терминах логики, между «несобственным» и «собственным» включением) вытекает из разграничения между правилами, во всех случаях «заменяющими» А на В + С, и правилами, состоящими из ряда альтернативных подправил. Например, такое правило, как N → А + N, основано на дистрибуционном тождестве John и poor John, man и old man и т. п. С другой стороны, такое правило, как
означает, что дистрибуция словосочетаний типа eat meat 'есть мясо', с одной стороны, и слов типа die 'умереть'— с другой, включена в дистрибуцию класса глагольных групп.
Различие между эндоцентрическими и экзоцентрическими конструкциями, с одной стороны, и между двумя основными подтипами эндоцентрических конструкций (сочинительными и подчинительными), с другой стороны, находит отражение в форме правил «подстановки», описывающих образование этих конструкций. Следует, однако, заметить, что понятия эндоцентричности, подчинения и т. п. не имеют никакой систематической значимости в грамматике «подстановок» типа описанной выше; другими словами, эти понятия не используются в грамматике как таковые. Кроме того, поскольку действие обязательного правила (или множества подправил) заключается в замене всех А на В + С, не имеет значения, как назвать А: после действия правила А исчезает и остается только в качестве наименования высшего «узла». Например, выбор терминов именная трупа (NP) и глагольная группа (VP) в первом правиле грамматики
Σ → NP + VP
совершенно произволен в «подстановочной» грамматике структуры составляющих, так как и NP и VP непременно «заменяются» на другие элементы или конструкции. (Их можно было бы с равным успехом назвать Y и Z.) Связь между именными группами, существительными и местоимениями (различных подклассов) выражает не применяемая к ним номенклатура, как в «классификационных» описаниях, а тот факт, что они исходят из некоторого общего «узла».
В отношении понятий эндоцентричности — экзоцентричности и подчинения — сочинения категориальная грамматика может претендовать на более верную формализацию принципов, намеченных Блумфилдом и развитых (с привлечением множества примеров из многих различных языков) его последователями. Как мы видели, основным понятием категориальной грамматики является понятие «зависимости» (которое обычно можно приравнять к подчинению); а различие между эндоцентрическими и экзоцентрическими конструкциями очевидно из структуры зависимой категории при «сокращении»: если числитель и знаменатель тождественны, конструкция эндоцентрическая, если нет — экзоцентрическая (ср. выше, § 6.3.2).
6.5. КОНТЕКСТНО-СВЯЗАННАЯ ГРАММАТИКА
6.5.1. ТЕРМИН «КОНТЕКСТНАЯ СВЯЗАННОСТЬ»
Мы должны теперь ввести разграничение между контекстно-связанными и контекстно-свободными правилами. (В качестве синонимов термина «контекстно-связанный» в литературе употребляются также термины «конктекстно-ограниченный» и «контекстно-зависимый».)
Все правила, приведенные до сих пор, были контекстно-свободными в том смысле, что символ, фигурирующий слева от стрелки подстановки, заменялся на «выходе» правила символом или цепочкой символов, стоящих справа от стрелки в формулировке правила. Так, например, следующее правило (ср. § 6.2.6)
N → N + and + N
интерпретировалось как инструкция «заменить» N на N + and + N (факультативно или обязательно) в любой цепочке символов, к которой это правило может быть применено. Другими словами, единственное условие действия правила заключается в появлении N на «входе» правила. Например, если на «входе» имеем альтернативные цепочки
(i) X + N + Y
(ii) W + N + Z,
то на «выходе», после действия рассматриваемого правила, будет в одном случае
X + N + and + N + Y
и в другом случае
W + N + and + N + Z.
Суть в том, что на действие правила не накладывается никаких контекстуальных ограничений.
Предположим, однако, что мы сформулировали это правило следующим образом:
N → N + and + N / в контексте X + ... + Y.
Можно было бы условиться, что это означает, что N следует «заменить» (факультативно или обязательно) только в том случае, если на «входе» непосредственно слева от него стоит X, а справа непосредственно от него — Y. В таком случае правило применялось бы к (i), но не к (И). Указание на контекстуальные условия, данное справа от наклонной черты в вышеприведенном правиле, превращает его в контекстно-связанное правило.
6.5.2. РАЗЛИЧНЫЕ ВИДЫ КОНТЕКСТНО-СВЯЗАННЫХ ГРАММАТИК
Могут быть сформулированы самые различные контекстно-связанные правила тех или иных типов и подтипов. Мы ограничим наше внимание теми, которые относятся к сфере грамматик непосредственных составляющих (формализуемых в виде набора упорядоченных или неупорядоченных, факультативных или обязательных, рекурсивных и нерекурсивных конкатенирующих правил). Любая такая грамматика, включающая одно или более контекстно-связанных правил, определяется как контекстно-связанная грамматика структуры непосредственных составляющих.
Внутри этого класса грамматик можно различать те, в которых X и Y, фигурируя в правилах только что приведенного типа, могут обозначать каждый только один символ; те, в которых или X, или Y, или тот и другой могут обозначать цепочку более чем из одного символа и т. д.
Мы будем считать, что занимающий нас здесь класс контекстно-связанных грамматик определяется тем условием, чтобы X и Y в правилах типа
А → В / в контексте X + ... + Y
могли обозначать независимо друг от друга любое конечное число конкатенированных символов, но чтобы А непременно было единичным символом. Кроме того, мы примем, что В не может быть тождественным с A и не может быть «нулевым» (ср. § 6.2.11). Эти условия допускают включение в систему в качестве «правильно построенных» следующие правила:
(a) Р → Q / в контексте Е + F + ... + G
(b) Р → Q + R / в контексте E+ ... + G+ H + K+L
(c) P → R + S + T / в контексте G + ... + Н
и т. д.
Они воспрепятствуют включению в грамматику правил, подобных следующим:
(d) Р → Р / в контексте Е + ... + F
(е) Р → Ø / в контексте Е +...+ Р.
Правило (d) «неправильно построено» потому, что оно заменяет Р само на себя (то есть нарушает условие, требующее, чтобы А и В не были тождественны). Правило (е) содержит «нулевой» символ (Ø) непосредственно справа от стрелки: это определяет правило (е) как правило элиминации («заменить Р на нуль» означает «элиминировать Р»; на «выходе» правила (е), если бы мы допустили его включение в систему, было бы E + F, выведенное посредством данного правила из E + P + F на «входе»).
Следует обратить внимание на то, что в вышеприведенных правилах одни символы напечатаны курсивом, другие — прямым шрифтом. Символы, напечатанные курсивом, являются постоянными, прочие — переменными[45]. Мы вернемся ниже к разграничению постоянных и переменных (см. § 6.6.6). Для целей настоящего раздела сведем различие к следующему: если символ появляется в какой-либо части правила в качестве постоянной, это означает, что правило относится к этому конкретному символу; если символ появляется в качестве переменной, это означает, что правило применяется к любой постоянной, которая определена как принадлежащая к классу, обозначенному посредством этой переменной.
Для настоящего изложения это различие существенно лишь постольку, поскольку оно разграничивает реальные правила грамматики (которые, как мы примем, не содержат никаких переменных) и отвлеченные характеристики формы этих правил. Другими словами,
А → В / в контексте X + ... + Y
не является правилом, но изображает целый класс правил, различающихся «значениями», которые определяются как допустимые для переменных А, В, X и У. Условия, которые ограничивают область допустимых значений переменных, были приведены выше.
6.5.3. КОНТЕКСТНО-СВЯЗАННЫЕ ГРАММАТИКИ ВКЛЮЧАЮТ В СЕБЯ КОНТЕКСТНО-СВОБОДНЫЕ ГРАММАТИКИ