- •Лексикостатистическое датирование доисторических этнических контактов (на материале племен эскимосов и североамериканских индейцев)
- •Определение константы
- •Коэффицент сохраняемости
- •Опытный словарь
- •Определение интервала времени
- •Колебания
- •Причина константы скорости
- •Дивергенция (расхождения)
- •Родственные языки
Дивергенция (расхождения)
Датирование доисторических событий с помощью словарной статистики возможно благодаря языковой дивергенции. Самым простым случаем дивергенции является такой, когда имеет место миграция или внезапное завоевание, которое раскалывает общество на две части и когда условия препятствуют населению обеих частей поддерживать эффективную связь друг с другом после разделения. Изменения, которые происходят вследствие этого в словаре обоих языковых коллективов, проходят, таким образом, независимо друг от друга; слова основного словаря, которые заменяется другими в одном коллективе, могут утрачиваться, но могут и сохраняться в другом. Спустя, скажем, 1000 лет образуются два различных языка, каждый из которых сохранил определенную часть прежде свойственного им обоим основного словаря. Количество сохранившихся общих элементов, подсчитанное с помощью нашего опытного списка, составило бы приблизительно 81 %.
Поскольку изменения в обоих языках происходили независимо друг от друга, то можно ожидать, что словари языков совпадают друг с другом на 81 процент от 81 процента случаев, короче — на 66 %. Через 2000 лет, если каждый язык будет иметь только 66 % от ранее общего словаря, оба будут совпадать уже только на 43 %. Отношение времени к проценту совпадения в языках, стоящих на одном уровне развития, должно быть выражено через удвоенное время, прошедшее с момента их разделения, поскольку дивергенция идет одновременно по двум линиям.
*****
Родственные языки
Слова двух языков, между которыми существуют регулярные соответствия, называют родственными. Доля родственных слов определяет степень близости двух языков. Близость языков принято оценивать по шкале Яхонтова:
№ |
Уровень взаимопонимания |
Примерное время расхождения |
Примеры языков и диалектов |
1 |
свободное общение |
200 лет |
диалекты русского языка в Сибири, английского языка в США |
2 |
отдельные случаи взаимонепонимания |
500 лет |
русский - украинский, татарский - казахский |
3 |
отдельные знакомые слова и фразы |
1000-1500 лет |
русский - польский, испанский - итальянский |
4 |
общение невозможно, но при изучении обнаруживаются общие слова и правила |
2000 лет |
русский - литовский, английский - шведский |
5 |
родство языков может обнаружить только специалист |
3000 - 4000 лет |
русский - английский, тибетский - китайский |
6 |
родство языков доказывается лишь путем сравнения реконструируемых праязыков |
6000 лет |
русский - татарский, тибетский - кетский |
Обычно, при 90% родственных слов два языка считаются диалектами одного, между ними существует хорошая взаимная понимаемость.
Менее 10% родственных слов говорят о крайней удаленности двух языков или о случайном характере обнаруженных соответствий (и такое бывает! существующие методики позволяют свести к минимуму случайные соответствия, но полностью избавиться от них невозможно в принципе). Приведу для сравнения данные доли родственных слов (по методике Сводеша):
Русский - белорусский 92%
Русский - украинский 86%
Русский - польский 77%
Русский - чешский / словацкий 74%
Русский - болгарский 74%
Русский - словенский 74%
Русский - сербский 71%
Русский - македонский 70%
Чрезвычайно важно знать, какие именно слова сравнивать. Если, например, мы возьмем случайный текст на русском языке по компьютерно-интернетной тематике, насыщенный словами драйвер, сервер, провайдер, траффик, сайт и т.д., мы обнаружим, что русский язык чрезвычайно близок английскому. Очевидно, наш вывод будет неверным, потому что в других слоях русской лексики близость русского и английского будет намного меньше. Как же получить достоверный результат?
Компаративистика исходит из того, что в языке существует основной словарный фонд - несколько сотен слов, которые очень устойчивы по отношению к заимствованиям. Приведём одно из определений основного словарного фонда:
"Сюда относятся основные местоимения, первые числительные, основные анатомические и космические названия, основные термины родства и социальные термины, глаголы, выражающие самые насущные, элементарные действия и состояния; в отдельных случаях сюда же приходится относить названия ряда животных и растений, поскольку имеются основания постулировать знакомство народа с этими животными и растениями с незапамятных времен"
Оговорим сразу: с основным словарным фондом не все просто и однозначно.
Во-первых, в разных языках он несколько различается: вряд ли в языке эскимосов основной фонд будет включать понятия, важнейшие для земледельцев юга Европы, а в основном фонде арабов будут китобойные термины.
Во-вторых, хотя слова основного фонда наиболее устойчивы по отношению к заимствованиям, их устойчивость не абсолютна.
Классический пример: во всех славянских языках орган зрения обозначается словом око (с учетом регулярных соответствий).
Но вот в современном русском языке употребляется слово глаз, заимствованное из германских языков, да еще и с другим значением - в германском это - "янтарь, прозрачный."
В 1952 г. американский лингвист М. Сводеш заложил основы метода глоттохронологии.
Глоттохронология - система статистического анализа родственных языков, позволяющего оценить примерное время начала расхождения их из общего языка-основы. Основную роль в методе Сводеша играл "двухсотсловный список" - ядро основного словарного фонда. Обработав имеющиеся данные по языкам и диалектам американских индейцев, Сводеш пришел к выводу, что за 1000 лет 80.5-81% слов двухсотсловного списка сохраняется. Обработав по своей методике индоевропейские языки и диалекты, Сводеш получил результаты, очень хорошо согласующиеся с внеязыковыми данными.
За прошедшие полвека методика Сводеша была уточнена и дополнена. Сегодня чаще работают со "стословным списком" Старостина, предварительно "отсеяв" из него заимствованные слова. Глоттохронологический метод дал очень хорошие результаты в отношении огромного количества групп языков и активно используется сегодня.