2.2 Атрибуты лексем

Если шаблону соответствует несколько лексем, лексический анализатор должен обеспечить дополнительную информацию о лексемах для последующих фаз компиляции. Например, шаблон num ( рис.4) может соответствовать как строке 3.1416, так и 2.19, и при генерации кода крайне важно знать, какая именно строка соответствует шаблону.

Лексический анализатор хранит информацию о лексемах и связанных с ними атрибутах. На практике лексемы обычно имеют единственный атрибут – указатель на запись в таблице символов, в которой хранится информация о соответствующей лексеме. Для диагностических целей могут понадобиться как лексемы идентификаторов, так и номера строк, в которых они впервые появились в программе. Вся эта (и другая) информация может храниться в записях в таблице символов.

Пример 2

Лексемы и связанные с ними значения атрибутов для инструкции

E = M * 2

записываются как последовательность пар:

<id, указатель на запись в таблице символов для E>

<assign_op,>

<id, указатель на запись в таблице символов для M>

<mult_op,>

<num, целое значение 2>

В некоторых парах нет необходимости в значении атрибута – первого компонента вполне достаточно, чтобы идентифицировать лексему. В этом примере лексема num задана атрибутом с целым значением. Компилятор может хранить строку символов, составляющих число, в таблице символов, сделав, таким образом, атрибут лексемы num указателем на запись в таблице символов.

2.3 Общие принципы построения лексических анализаторов

Лексический анализатор имеет дело с такими объектами, как различного рода константы и идентификаторы (к последним относятся и ключевые слова). Язык констант и идентификаторов в большинстве случаев является регулярным — то есть может быть описан с помощью регулярных грамматик. Распознавателями для регулярных языков являются конечные автоматы. Существуют правила, с помощью которых для любой регулярной грамматики может быть построен недетерминированный конечный автомат, распознающий цепочки языка, заданного этой грамматикой. Конечный автомат для каждой входной цепочки языка дает ответ на вопрос о том, принадлежит или нет цепочка языку, заданному автоматом.

В общем случае задача сканера несколько шире, чем просто проверка цепочки символов лексемы на соответствие ее входному языку. Кроме этого, сканер должен выполнить следующие действия:

четко определить границы лексемы, которые в исходном тексте явно не заданы;
выполнить действия для сохранения информации об обнаруженной лексеме (или выдать сообщение об ошибке, если лексема неверна).

2.4 Определение границ лексем

Выделение границ лексем представляет определенную проблему. Ведь во входном тексте программы лексемы не ограничены никакими специальными символами. Определение границ лексем – это выделение тех строк в общем потоке входных символов, для которых надо выполнять распознавание. B общем случае эта задача может быть сложной и тогда требуется параллельная работа лексического анализатора, синтаксического разбора и, возможно, - семантического анализа. Для большинства входных языков границы лексем распознаются по заданным терминальным символам. Эти символы – пробелы, знаки операций, символы комментариев, а также разделители (запятые, точки с запятой и т.п.) Набор таких терминальных символов может варьироваться в зависимости от синтаксиса входного языка.

Как правило, лексические анализаторы действуют по следующему принципу:

очередной символ из входного потока данных добавляется в лексему всегда, когда он может быть туда добавлен;
как только символ не может быть добавлен в лексему, то считается, что он является границей лексемы и началом следующей лексемы.

При этом от пользователя требуется явно указать с помощью пробелов (или других незначащих символов) границы лексем. Такой подход возможен для большинства входных языков.

<<< < Предыдущая 1 2 3 45 / 585 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
13.09.20192.53 Mб27Ворожбянов Метал.констр(курс раб)(исправл).doc
#
22.03.20155.24 Mб777Врачебный контроль в АФК.doc
#
22.12.2018776.19 Кб31ВСЕ 2003.doc
#
25.08.20191.15 Mб29Всё о Кофе.docx
#
22.03.2015219.98 Кб88все ответы по фее. 1-60.docx
#
31.10.20182.51 Mб182Все_пособие_редактир.doc
#
19.09.2019555.1 Кб21вторая 20.docx
#
25.09.201933.73 Кб21вторая глава 2 вариант.docx
#
02.08.201975.26 Кб41Второстепенные члены предложения.doc
#
19.08.2019109.06 Кб21ВУК 1.doc
#
19.08.2019134.14 Кб3ВУК 2.doc