Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Mikhalkova-OnelinerGraphsUPD0910.doc
Скачиваний:
9
Добавлен:
18.04.2015
Размер:
218.11 Кб
Скачать
    1. Результаты моделирования

Анализ 20 шуток, представленных с помощью теоретико-графовой модели, выявил следующие факты, свидетельствующие о наличии некоторых формализуемых закономерностей.

Слова и цепочки группы I, если группа I не представлена только изолированными вершинами, не вклиниваются в цепочки группы R и обычно образуют отдельную цепочку с конечной вершиной. В примере выше это значимо в случае, где дискриминация сделана по правой вершине (см. Fig. 2): единственное слово из группы I "йода" образует конечную вершину в коллокации "из (r3) йода (i)", хотя в самом предложении оно стоит между двумя другими словами "из – йода – делают". Даже если изменить порядок слов в этом предложении: "Обычно из йода решетку делают", то место группы I в графе не изменится. Или в другом примере "Если (If) я (R) буду (will) постоянно (r1) держать (do) себя (r2) в (r3) рамках (r4), я (R) превращусь (will do) в (i1) портрет (i2)" встречается цепочка из четырех вершин ("держать (do) себя (r2) в (r3) рамках (r4)"). Тем не менее, группа I не разбивает ее, хотя грамматически возможно и такое сочетание "держать (do) портрет (i2) в (r3)/(i1) рамках (r4)".

Закономерно, что отчужденность группы I от группы R вызвана ее "неколлокализованостью". Если группа R формирует цепочки коллокаций, которые употребляются в повседневной речи и жанрово (дискурсивно, стилистически) менее зависимы (рано или поздно, нашел на даче, это те которые, свободную продажу оружия), то группа I отвечает за оригинальность шутки, и часто ее прикрепление к графу обусловлено грамматической связью, которая не запрещает сочетание двух слов: одно обычно принадлежит группе R и входит в более длинную цепочку, другое принадлежит группе I (я маникюр, или пьяной, с телефона, что я). Соответственно, встречаемость таких сочетаний в корпусе близка к 1.

Также отметим, что слова-вершины из группы I почти не встретились в циклах (всего в 2 случаях из 20). Дальнейшее изучение этого факта, возможно, покажет, чем оно обусловлено и есть ли у циклов в модели особая роль.

  1. Заключение

Разрабатываемый алгоритм распознавания шутки, основанный на концепции инвективных имен, предполагает сочетание нескольких видов лингвистического анализа – в первую очередь, морфологического и компонентного. Так, определение частеречной принадлежности играет роль при определении субстанциональной части групп R и I. Компонентный анализ, который дает более точное представление о семантических частях шутки, может быть произведен при помощи составленной на основе корпуса шуток базы данных из наиболее встречаемых в компонентах R и I слов. Так, например, часто упоминающееся в шутках имя реального человека (Андрей Малахов, Филипп Киркоров) в определенном контексте из слов с достаточным, согласно базе данных, весом могло означать, что в данном тексте оно тоже используется в комическом смысле.

Теоретико-графовая модель, рассмотренная нами выше показывает, что есть также определенные структурные закономерности внутри сочетания любых слов в шутке – необязательно, чтобы эти слова были значимыми именами с соответствующим окружением. Поэтому в случаях, где шутка не привязана к известному лицу или стереотипному персонажу (национальности, фольклорным героям и т.п.), графовая модель может быть применена вместо компонентного анализа либо может использоваться на стадии проверки.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]