- •Формализация смысла комических текстов в жанре one-liner при помощи теоретико-графовой модели
- •625003 Г. Тюмень, ул. Семакова, д. 10
- •625003 Г. Тюмень, ул. Семакова, д. 10
- •Введение1
- •Теоретико-графовая модель шутки в жанре one-liner
- •Лингвистические основания для построения модели
- •Построение модели
- •Результаты моделирования
- •Заключение
- •Список литературы
Теоретико-графовая модель шутки в жанре one-liner
На современном этапе развития лингвистики некоторые закономерности естественного языка выявляются с помощью графов. Это стало возможным благодаря череде открытий, и в первую очередь такому, как закон Ципфа, за которым последовала серия работ о статистике распределения слов в тексте [8]. Сегодня практическое применение графы находят в машинном переводе, при индексации и генерировании текстов. Так, например, в конце 1990-х появились построенные на статистических основаниях генераторы текста, которые применяют изначально не имеющие отношения к лингвистике цепи Маркова [9].
Применение графов для формализации текстов определенных жанров также вполне закономерно, т.к. теоретико-графовые модели помогают отразить спорные связи между группами слов как синтагматического, так и парадигматического характера. Например, Н.Д. Москин в [10] использует нечеткие теоретико-графовые модели для описания фольклорных мотивов и поиска схожих мотивов в группах фольклорных текстов, собранных в разных районах.
Лингвистические основания для построения модели
Предлагаемая нами модель шутки в жанре one-liner нацелена на теоретическое обоснование некоторых, возможно, общеизвестных, но, тем не менее, не обоснованных с формальной точки зрения данных об исследуемом типе высказываний (поэтому модель и названа теоретико-графовой). В целом, она построена на основе следующих закономерностей естественного языка.
Существующая в естественном языке тенденция к экономии усилий приводит к формированию устойчивых словосочетаний, причем степень этой устойчивости может быть различной. Так, разные лингвисты предлагают собственные классификации устойчивых словосочетаний, начиная от более или менее частотных коллокаций2 и заканчивая паремиологическими единицами (крылатыми фразами, цитатами и пр.), где статистически устойчивая связь формируется внутри целых предложений и даже небольших текстов (например, в пословицах, где есть более, чем одно предложение).
Сочетание слов "деревянный стол" уже можно считать своего рода коллокацией3, так как, благодаря культурным, историческим и пр. факторам экстралингвистический контекст данного словосочетания способствовал формированию определенной статистической зависимости между данными словами. Так, в "Национальном корпусе русского языка" сочетание "деревянный стол" именно в данной грамматической форме встречается 52 раза. Также, в связи с экстралингвистическими факторами, можно ожидать, что словосочетания "красивый стол" (3), "любимый стол" (2) встретятся реже, а следующий ряд словосочетаний вообще не встретится или встретится в единичных случаях: "безопасный стол" (0), "остепененный стол" (0), "крысиный стол" (0). Первый ряд словосочетаний имеет более ограниченное употребление в связи с тем, что он дискурсивно и понятийно более зависим: подобные словосочетания (красивый стол, любимый стол) можно ожидать в высказывании определенного жанра (комплимент, реклама, мемуарная проза и т.д.), в то время как словосочетание "деревянный стол" жанрово менее зависимо. Касательно последнего ряда словосочетаний с нулевой встречаемостью, можно отметить, что, исходя из лингвистической компетенции авторов данной статьи, они представляют собой словосочетания с неопределенной понятийной и дискурсивной основой. У них есть потенциал оказаться в художественном тексте, в шутке, ругательстве, но этот потенциал сначала реализуется в речи, а потом "маловероятная" коллокация под действием каких-либо факторов имеет шанс закрепиться в языке (например, в виде фразеологизма, идущего от какого-либо известного лица4).
Коллокации можно представить как базовые единицы "долгосрочной памяти" языка, обладающие не только парадигматической (фонемный состав, словарь, набор грамматических форм), но и синтагматической связью (на каждом уровне коллокации – фонетическом, лексическом, грамматическом – закреплена определенная форма, и коллокация существует только как фиксированная последовательность этих форм).