6.2. Обратная польская запись

Обратная польская запись (ОПЗ) или обратная польская строка предполагает запись языковых конструкций в следующем виде:

аргумент1 аргумент2 аргументn операция.

Например, выражение a+b записывается, как ab+, а выражение d+b*c+q – как dbc*+q+.

Используя этот прием, можно записывать и более сложные конструкции. Например, в процессе построения интерпретаторов и компиляторов в ОПЗ записываются в том числе и конструкции безусловного и условного переходов, а также циклические конструкции.

Этот прием можно применить и для формализации записи на естественном зыке, например фразу «автомобиль движется к городу» можно записать так

«автомобиль город двигаться к»,

фразу «автомобиль марки Нива движется к городу Томску», как

«автомобиль Нива марка город Томск имя двигаться к».

При этом каждое отношение должно иметь фиксированное число аргументов (в данном примере по два аргумента в каждом отношении).

К преимуществам ОПЗ можно отнести наличие стандартного алгоритма ее генерации при анализе языковых конструкций (как правило, КС-грамматик). Основное применение данная модель находит при решении задачи трансляции с языков высокого уровня, так как, помимо отмеченного преимущества, ОПЗ легко интерпретируема с помощью СТЕКа. Для этого просматриваем цепочку слева направо, помещая аргументы в СТЕК (о стеках и очередях []), а как встречается символ операции – выполняем данную операцию и заменяем ее аргументы в СТЕКе на полученное значение.

Пример. dbc*+q+.

d→ CТЕК, b→ СТЕК, с-→ CТЕК;

таким образом, в стеке имеем dbc;

* – заменяем два верхних элемента в стеке на b*c;

если b*c=k, то в СТЕКе получаем dk;

+ – заменяем два верхних элемента в СТЕКе на d+k;

если d+k=p, то в СТЕКе получаем p;

q→ СТЕК;

в стеке имеем pq;

+ – заменяем два верхних элемента в стеке на p+q;

если p+q=s, то в СТЕКе имеем s.

Таким образом, в стеке имеем результат.

В тоже время для анализа естественных зыков модель все же неудобна по причинам, изложенным в 6.3.

6.3. Недостатки применения аппарата формальных грамматик

Модель формальных грамматик имеет два основных недостатка.

A) В естественном языке очень много понятий, следовательно, в грамматике будет очень много нетерминалов.

B) Доказано, что естественные языки относятся к классу 0 по Хомскому, следовательно, задача распознавания и генерации фраз естественного языка алгоритмически неразрешима.

Второе ограничение в принципе невозможно преодолеть.

Исследовательский опыт позволяет констатировать неэффективность применения формальных грамматик и связанных с ними моделей, таких как конечные и магазинные автоматы, ОПЗ, для анализа естественных языков.

Существует несколько приближенных моделей естественного языка, использующихся на практике. Например, модель непосредственных составляющих, модель синтаксического управления, модель глубинных или семантических падежей, модель расширенных сетей переходов. В последнее время все более широкое применение находит применение нейронных сетей.

Большая часть моделей основывается на принципах, установленных в семиотике – науке о знаковых системах, и прежде чем рассматривать конкретные модели, необходимо в общих чертах познакомиться с семиотикой.

<<< < Предыдущая 17 18 19 20 21 22 23 24 25 26 27 2829 / 5429 30 31 32 33 34 35 36 37 38 39 40 41 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
13.11.2019186.34 Кб8Программирование_Вагарина_1.docx
#
12.02.201587.75 Кб6Продвижение лекции КОМ МНЖ.docx
#
25.09.20191.37 Mб57Проектирование лекции.docx
#
09.11.20194.65 Mб55Проектирование мостовых переходов ч1.doc
#
09.11.201912.2 Mб103ПРОЕКТИРОВАНИЕ МОСТОВЫХ ПЕРЕХОДОВ ч2 исп.doc
#
10.11.20181.44 Mб15Пролог.doc
#
12.02.2015489.98 Кб37Промышленность 2012.doc
#
31.08.201934.59 Кб6Просвещение в годы НЭПа.docx
#
22.11.201942.56 Кб13Протекционизм.docx
#
29.03.2016946.39 Кб114ПРОЦЕССЫ ПОРОШКОВОЙ МЕТАЛЛУРГИИ.pdf
#
12.02.2015271.36 Кб27Прямая линия на плоскости.doc