Шрифт:
Интервал:
Закладка:
Действительно, подсчеты показывают, что стиль отдельных писателей можно характеризовать статистически, употребление отдельных частей речи, типов предложений и т. д. подчиняется определенной вероятностной закономерности.
Приведем несколько примеров. На пятьсот знаменательных слов у Куприна приходится семьдесят семь глаголов, у Пушкина — сто десять, у Чехова — сто двадцать семь. В прозе Симонова на пятьсот слов приходится сто семьдесят существительных, сорок девять прилагательных, семьдесят три местоимения, сто одиннадцать глаголов. У Шолохова соответственно двести шестнадцать существительных, семьдесят семь прилагательных, тридцать девять местоимений, семьдесят семь глаголов.
Еще более характерны числа, говорящие о соотношениях между частями речи у того или иного автора. «Лермонтов видит и изображает мир, Действительность в большем разнообразии качественных характеристик, признаков, чем это делает Пушкин: в среднем у Лермонтова 39 имен существительных из каждых 100 получают признаки прилагательных, а у Пушкина таких существительных всего 25; значит, речь и мышление Пушкина предметнее, Лермонтова — «качественнее». О сходной особенности речи и мышления двух авторов говорит и соотношение «наречие — глагол»: в среднем у Лермонтова на 100 глаголов приходится 42 наречия, а у Пушкина — всего 26; а это означает, что речь и мышление Лермонтова активнее окрашивают воспринимаемые процессы, чем это делают речь и мышление Пушкина. Интересно и то, что соотношение «существительное — глагол» и «глагол — существительное и прилагательное» оказываются у Пушкина и Лермонтова статистически равными, что позволяет опровергать гипотезу об особой глагольности речевого стиля Пушкина», — пишет Б. Н. Головин в книге «Язык и статистика».
А вот какие интересные данные были получены после подсчета названий цветов у. разных авторов в их прозе и стихах. В стихах об Америке Маяковского на тысячу слов текста приходится восемь цветообозначений, а в прозе, говорящей о той же Америке, — только два слова на тысячу. В военной лирике Симонова названия цветов употребляются в восемь раз чаще, чем в его же рассказах военных лет.
Вездесущие числа
Мы уже говорили, что стиль каждого большого поэта и писателя имеет свои количественные характеристики. Они начинают служить филологам и литературоведам, позволяя решать спорные вопросы об авторстве с помощью чисел. Так, кстати сказать, решили давний вопрос «о дедушке Гомере»: был ли автором «Илиады» один человек или же, как полагали многие специалисты, «Илиада» — сборник героических песен, лишь по традиции приписываемый великому слепцу.
Текст «Илиады» набили на перфокарты, затем ЭВМ тщательно проанализировала, то есть пересчитала все ритмические особенности каждой главы эпоса. Подсчеты машины неопровержимо показали: автором поэмы мог быть только один человек. Все главы «Илиады» сохраняют общее ритмическое единство.
С помощью чисел ученые начинают решать не толь» ко практические, прикладные задачи языкознания и литературоведения, но и многие теоретические вопросы, Например, определять степень заимствования одного языка из словарного запаса другого. Как известно, заимствуются обычно слова, обозначающие предметы быта, культуры, труда, которых не было ранее у того или иного народа (естественно, что вместе с предметом заимствуется и его название). Например, русское слово спутник вошло во все языки мира, равно как французское одеколон, арабское жирафа, австралийское бумеранг и т. п.
Все языки мира равны, на любом из них можно выразить все, что выражено на другом языке. Заимствования не говорят о том, что тот язык, из которого заимствуются слова — лучший, а который заимствует — худший. Однако разные языки по-разному восприимчивы к этим заимствованиям. Удивительной консервативностью обладает исландский язык. Иностранные слова практически в него не попадают, а новому понятию или термин ну подбираются свои собственные определения, средствами самого исландского языка. И вот футбол по-исландски звучит как кнаттспурна, то есть пинание мяча; дыня — как троллепли (яблоко великана), мотороллер — это трещащая гадюка, кинофильм — живой образ, ракета — огненный полет и т. п.
Другие языки, наоборот, весьма восприимчивы к иностранным словам (вероятно, многие читатели знают о знаменитой полемике, которую вели в прошлом веке романтики и архаисты во главе с адмиралом Шишковым, предлагавшим калоши именовать мокроступами). В албанском языке, как показывают подсчеты, из пяти тысяч ста сорока слов собственными являются лишь четыреста тридцать слов, все остальные заимствованы из других языков. В армянском языке полторы тысячи слов из одной тысячи девятисот сорока заимствованы из персидского, греческого, сирийского, парфянского, арабского языков. В корейском языке до семидесяти процентов заимствований из китайского; в современном английском от пятидесяти до семидесяти процентов всех слов заимствованы из французского, латыни и другие романских языков.
Ученые смогли проследить динамику этих заимствований. Известный датский лингвист Отто Есперсен исследовал несколько томов «Большого Оксфордского словаря» английского языка, в котором собрано около полумиллиона различных слов. Вслед за ним А. С. Бо провел подсчеты по всем томам этого монументального издания. Оказалось, что если принять количество заимствований в течение 1100–1600 годов за сто процентов, то около шестидесяти процентов слов было заимствовано в 1100–1400 годах, около двадцати — в 1401–1500 годах и примерно столько же — в 1501–1600 годах.
Однако эти подсчеты говорят лишь о том, сколько слов дожило до нашего времени. Обычный словарь ничего не скажет, сколько слов французского языка не дожило, хотя они и были заимствованы в то или иное время англичанами. Тут на помощь приходят словари не простые, а частотные.
Еще в 1947 году американский ученый Дж. Ципф обнаружил любопытнейшую связь между частотой употребления слова и его «возрастом». Чем выше эта частота, тем древнее слово. И, наоборот, слова с незначительной частотой, как правило, появились в языке сравнительно недавно (вы можете легко проверить по «Частотному словарю русского языка», о котором мы рассказывали). Там, где не помогает традиционная методика подсчета заимствований, срабатывает новая методика — по частотным словарям. Вот какие цифры были получены на материале частотного словаря английского языка. Оказывается, с 1100-го по 1400 год не шестьдесят, а все девяносто процентов слов было заимствовано из романских. На другие два периода (1401–1500 и 1501–1600 годы) остается лишь по пяти процентов от общего числа заимствованных слов.
Была найдена и не менее интересная зависимость между временем появления слова в английском языке и его длиной в слогах. Почти половина всех односложных слов в английском языке имеет возраст в восемьсот и более лет. Такой же солидный возраст у двусложных слов, но уже не половины от их общего числа, а только одной пятой. Трехсложных слов этого возраста — три процента, четырехсложных — один процент. А среди пятисложных слов в английском языке нет ни одного, которое бы имело возраст в восемь столетий — все они моложе!
Быть может, связь между временем и словами языка (английского, русского или любого другого языка мира) выражается не только в устойчивости слов, имеющих разное число слогов, но и в изменении всего словаря? Или по крайней мере какой-то его части? Нельзя ли найти лингвистические часы, подобные «часам» геологическим, хронологическим, астрономическим, с помощью которых мы определяем время событий?
Эта мысль пришла в голову американскому языковеду Морису Свадешу по аналогии с методом датирования по распаду радиоактивного углерода. Лингвистическим часам был посвящен целый очерк в первом издании этой книги. Их называли «почти точным инструментом», позволяющим датировать события, о которых, казалось бы, не осталось никаких вещественных памятников или памятников письма. Как же смотрит наука на эту проблему в наши дни?
Лингвистические часы
Проанализировав скорость изменения нескольких языков и языковых семей, Свадеш нашел, что она равна примерно восьмидесяти двум плюс-минус два процента за тысячелетие. То есть в языке за тысячу лет сохраняется около восьмидесяти процентов слов, входящих в ядро, в основную лексику языка…
Так ли это? Свадеш проанализировал древнеегипетский, китайский, романские языки. Если ход лингвистических часов объективен, как часов радиоуглеродных, то, стало быть, близкие результаты можно получить и на материале любых других языков мира. Однако когда ученые стали проверять эту «среднюю константу скорости», взяв другие языковые семьи, оказалось, что она не является всеобщей.
- Язык в языке. Художественный дискурс и основания лингвоэстетики - Владимир Валентинович Фещенко - Культурология / Языкознание
- Книга о букве - Александр Кондратов - Языкознание
- Введение в общую теорию языковых моделей - Алексей Федорович Лосев - Языкознание
- От первых слов до первого класса - Александр Гвоздев - Языкознание
- Введение в теоретическую лингвистику - Джон Лайонз - Языкознание