Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Московский государственный университет им. М.В. Ломоносова

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

15_Лексический анализ.doc

Скачиваний:

Добавлен:

27.09.2019

Размер:

200.7 Кб

Скачать

☆

1 / 31 2 3 > Следующая >>>

Лекция 15

Лексический анализ

Лексический анализ – первый этап работы любого компилятора. На этом этапе в исходном тексте программы выделяются основные лексические единицы (слова, или лексемы): идентификаторы, служебные слова, константы, метки и пр., которые заменяются условными кодами (дескрипторами). В результате формируется лексическая свертка исходной программы, представляющая собой последовательность дескрипторов лексем.

При проведении лексического анализа из текста программы исключаются комментарии, пробелы, символы табуляции и перевода строки. В ряде случаев также проверяется парность скобок.

Блок лексического анализа может быть организован в виде отдельной программы (как в трехпроходном компиляторе), либо в виде процедуры, которая вызывается по мере необходимости (как в одно- и двухпроходном компиляторе).

Уже отмечалось, что в лексической свертке каждая лексема заменяется дескриптором. Дескриптор имеет единый формат для всех типов лексем, и содержит два поля:

(<тип лексемы>, <указатель>)

<тип лексемы> – это, как правило, числовой код класса лексемы. Количество классов в языках программирования может быть различным. Наиболее распространенными классами являются:

идентификаторы (имена переменных, процедур, функций, меток и т.д);
служебные (ключевые) слова;
числовые константы (целые неотрицательные числа, состоят только из цифр). Лексическая свертка вещественного числа включает дескриптор целой части числа и дескриптор дробной части числа;
разделители (+ – * := ; пробел и т.д.).

Могут вводиться и другие классы. При этом предпочтительно разбивать множество слов языка программирования на такие классы, которые бы не пересекались между собой. Классы могут состоять из конечного числа лексем (разделители и служебные слова), либо из бесконечного или очень большого числа элементов (классы числовых констант и идентификаторов).

Лексемы собираются в таблицы – для каждого класса своя таблица. В поле дескриптора <указатель> содержится ссылка на строку соответствующей таблицы. Таблицы лексем для классов ключевых слов и разделителей встроены в компилятор, поэтому коды ключевых слов и разделителей всегда одни и те же в лексической свертке обрабатываемых текстов программ. Таблицы лексем для классов идентификаторов и числовых констант формируются на этапе лексического анализа. Поскольку тексты программ отличаются числом и именами переменных, количеством встречающихся числовых констант, коды идентификаторов и чисел различаются в лексической свертке различных программ. Конечность таблиц лексем объясняет ограничения, существующие в языках программирования на длину и количество различных используемых в программе идентификаторов.

Пример 1:

Вход лексического анализатора:

PROGRAM PRIMER;

VAR X,Y,Z : REAL;

BEGIN

X:=–3.14;

Y:=2;

Z:=X+Y;

END.

В качестве кодов классов лексем будем использовать числа: 10 – ключевое слово, 20 – разделитель, 30– идентификатор, 40 – числовая константа.

Внутренние таблицы лексического анализатора:

Таблица служебных слов (10)

№ п/п

Служебное слово

…

PROGRAM

BEGIN

END

VAR

REAL

INTEGER

…

Таблица разделителей (20)

№ п/п

Разделитель

…

;

–

…

Выходные таблицы лексического анализатора:

Таблица идентификаторов (30)

№ п/п

Идентификатор

PRIMER

Таблица констант (40)

№ п/п

Значение

Лексическая свертка исходного текста:

(10,1) (30,1) (20,1)

(10,4) (30,2) (20,3) (30,3) (20,3) (30,4) (20,2) (10,5) (20,1)

(10,2)

(30,2) (20,2) (20,9) (20,6) (40,1) (20,4) (40,2) (20,1)

(30,3) (20,2) (20,9) (40,3) (20,1)

(30,4) (20,2) (20,9) (30,2) (20,5) (30,3) (20,1)

(10,3) (20,4)

Обратите внимание, что число –3.14 кодируется четырьмя дескрипторами: “–“, “3”, “.”, “14”. «Сборка» вещественной константы происходит на этапе синтаксического анализа (например, проверяется, чтобы дробная часть записывалась через точку, а не через запятую).

1 / 31 2 3 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
15.09.20193.8 Mб01534_відк урок з укр. мови.doc
#
23.09.2019312.83 Кб5157138_44BBA_otvety_k_biletam_po_psihofiziologi...doc
#
24.11.2018556.54 Кб12158019.doc
#
05.11.2018525.82 Кб4158294_C593F_oborudovanie_dlya_obrabotki_davlen....doc
#
10.07.20198.64 Mб0159938.rtf
#
27.09.2019200.7 Кб415_Лексический анализ.doc
#
09.12.201828.5 Кб016 Control of Gene Expression.docx
#
26.08.20191.53 Mб1916 lander - _____ _. __.rtf
#
22.12.2018439.81 Кб316 Закрытый исходный код.doc
#
27.10.2018790.02 Кб516-30 білети.doc
#
24.09.201998.83 Кб316-30.docx