Добавил:

Studfiles2 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Санкт-Петербургский государственный электротехнический университет "ЛЭТИ"

Предмет:

Теория языков программирования

Файл:

ВОСХОДЯЩИЕ МЕТОДЫ ОБРАБОТКИ ЯЗЫКОВ / LR_K_GR.DOC

Скачиваний:

Добавлен:

01.05.2014

Размер:

263.68 Кб

Скачать

☆

<<< < Предыдущая 1 2 34 / 64 5 6 > Следующая >>>

4.2.3.Алгоритм построения управляющей таблицы для lr(0)-грамматики без -правил

Рассмотрим управляющую таблицу анализатора для LR(0)-грамматики G₂, приведенную на рис. 4.6. Каждый символ магазинного алфавита V_p (грамматическое вхождение символа грамматики из словаря V в правую часть правила вывода) можно интерпретировать как кодированное представление подцепочки из правой части правила, последним символом которой он является.

При такой интерпретации магазинный символ вталкивается только тогда, когда символ из верхушки магазина является кодированным представлением префикса подцепочки, представляемой вталкиваемым в магазин символом, или когда вталкиваемый символ представляет новый префикс правой части какого-либо правила. Перенос символов в магазин осуществляется до тех пор, пока в верхушке магазина не окажется символ, являющийся кодированным представлением основы. В этом случае цепочка магазинных символов, соответствующих основе, выталкивается из магазина, и в магазин вталкивается символ, который представляет подцепочку, совместимую с подцепочкой, представляемой магазинным символом, расположенным под основой.

Рассмотрим, например, вторую строку управляющей таблицы, отмеченную грамматическим вхождением a₁, которое представляет префикс правой части правила (1). Пусть b – текущий входной символ. Согласно правилу (1) за a₁может следовать грамматическое вхождение нетерминала A₁ или символ, представляющий подцепочку, порождаемую вхождением A₁. Цепочка, порождаемая A₁, может начинаться либо вхождением b₃ ( правило (3)), либо вхождениемB₄ (правило (4)), которое в свою очередь порождает цепочку, начинающуюся с a₅ или c₆. Следовательно, для входного символа b в магазин можно втолкнуть только грамматическое вхождение b₃, которое является кодированным представлением префикса правой части правила (3).

Строка таблицы, отмеченная маркером дна магазина , соответствует начальной конфигурации алгоритма. В начальный момент времени в магазин можно записать только грамматическое вхождение a₁или с₂, которые представляют префиксы цепочек, выводимых из начального вхождения S₀, (грамматического вхождения начального символа грамматики S, входящего в правую часть нулевого правила вывода пополненной грамматики).

Как следует из таблицы, функция действия f(u) не зависит от текущего входного символа, а определяется только верхним символом магазина. Это означает, что для выбора нужного действия (переноса или свертки) алгоритм не должен заглядывать вперед на символы входной цепочки и, следовательно, k=0. Алгоритм построения управляющей таблицы для LR(0)-грамматик основывается на рассмотрении пар грамматических вхождений, которые могут быть представлены соседними магазинными символами в процессе разбора допустимых цепочек.

Введем ряд понятий, которые понадобятся для построения управляющей таблицы.

Пусть Х_i и Z_i – грамматические вхождения символов Х и Z в правую часть i-го правила, a Y_j – грамматическое вхождение символа Y в правую часть j-го правила. Определим множество ВПЕРВ( Y_j) (ВХОДИТ_ПЕРВЫМ), в которое включим Y_j и все грамматические вхождения, которыми могут начинаться цепочки, выводимые из Y.

ВПЕРВ(Y_j) = { Y_j}  { X_i Y   A  X и

Xi - самое левое грамматическое вхождение в правую часть правила A  X} .

Заметим, что если в грамматике есть правила с пустой правой частью, то на последнем шаге вывода они не применяются.

Используя множества ВПЕРВ, определим отношение ВПОД (ВХОДИТ_ПОД) следующим образом:

X_i ВПОД Y_j – это множество {( X_i,Y_j)  A X_iZ_i  R и Y_jBПЕРВ(Z_i) } ;
 ВПОД Y_j – это множество { ( ,Y_j)  Y_jBПЕРВ(S₀) } .

В последнем определении S₀ – начальное вхождение.

Отношение X_i ВПОД Y_j определяет множество Q грамматических вхождений X_i, для которых представляющие их магазинные символы могут встретиться в магазине непосредственно под символом, представляющим Y_j_.

Отношение ВПОД будем задавать с помощью матрицы, содержащей n столбцов и n+1строк, где n – число грамматических вхождений пополненной грамматики G’. Первые n строк и столбцы матрицы отмечены грамматическими вхождениями, а последняя отрока – маркером дна магазина. Если X_i ВПОД Y_j, то элемент матрицы, расположенный в строке X_i и столбце Y_j, равен 1.

Пример 4.2.

Построим матрицу отношения ВПОД для грамматики G₂('см. рис. 4.3).

Непосредственно из правил вывода (1) и (4) получим:

A₁ВПОД b₁ и B₄ ВПОД b₄.

Из определения отношения ВПОД  ВПОД Y_j тогда и только тогда, когда Y_j  ВПЕРВ(S₀). Из S можно вывести цепочки:

S  a₁A₁b₁ и S  c₂ .

Следовательно, ВПЕРВ(S₀) = {a₁, c₂, S₀} и  ВПОД а₁,  ВПОД c₂и  ВПОД S₀_.

Рассмотрим правило (1). Из определения отношения ВПОД следует, что a₁ВПОД Y_j для всех. Y_j  ВПЕРВ(A₁). Из А можно вывести цепочки:

A  b₃S₃, A  B₄b₄ c₆b₄ , A  B₄b₄ a₅A₅b₄ .

Следовательно, ВПЕРВ (А₁) = { a₅, b₃, c₆, A1, B4 } и a₁ВПОД a₅, a₁ВПОД b₃,

a₁ВПОД c₆, a₁ВПОД A1, a₁ВПОД B4.

Поступая подобным образом для правил (3) и (6), получим матрицу отношения ВПОД, приведенную на рис. 4.7.

	S₀	a₁	A₁	b₁	c₂	b₃	S₃	B₄	b₄	a₅	A₅	c₆
S₀
a₁			1			1		1		1		1
A₁				1
b₁
c₂
b₃		1			1		1
S₃
B₄									1
b₄
a₅						1		1		1	1	1
A₅
c₆
	1	1			1

Риc. 4.7

Опишем алгоритм построения управляющей таблицы LR(0)-анализатора (множества LR(0)-таблиц) для LR(0)-грамматики, не содержащей правил с пустой правой частью (-правил). Этот алгоритм можно также использовать для проверки принадлежности КС-грамматики классу LR(0).

Вход

КС-грамматика G = < T, N, S, R > без -правил.

Выход

Множество LR(0)-таблиц для грамматики G или сообщение о том, что грамматика G не является LR(0)-грамматикой.

Описание алгоритма

Построить пополненную грамматику G’ для исходной грамматики G.
Вычислить отношения ВПОД для грамматических вхождений грамматики G’.
Определить функции переходов g(Х) следующим образом:

а) Построить таблицу, содержащую по одному столбцу для каждого символа из V  {} и одной отроке для каждого грамматического вхождения грамматики G’и маркера дна. Элемент в строке, помеченной грамматическим вхождением Х_i или маркером дна , и столбце, отмеченном символом грамматики Y, должен содержать все грамматические вхождения, для которых справедливо отношение Х_i ВПОД Y_j. Заметам, что некоторые элементы построенной таким образом таблицы могут содержать более одного грамматического вхождения, т.е. таблица может быть недетерминированной.

б) Интерпретируя построенную таблицу как таблицу конечного автомата (состояния - грамматические вхождения и маркер дна (начальное состояние), а входные символы - символы из V  {}), определить тип автомата: детерминированный или недетерминированный. Недетерминированный автомат преобразовать в эквивалентный ему детерминированный автомат.

в) Определить магазинный алфавит V_p так, чтобы каждому состоянию детерминированного конечного автомата соответствовал ровно один магазинный символ.

В качестве символов алфавита V_p можно использовать любые символы, не являющиеся символами словаря V’ грамматики G’. Для сохранения наглядности цепочек, представимых магазином, будем считать, что символы из V_p совпадают по написанию с соответствующими грамматическими вхождениями. Если магазинный символ представляет множество грамматических вхождений, то индексы магазинных символов будем обозначать строчными латинскими буквами.

г) Заменить совокупности грамматических вхождений, отмечающих состояния автомата, соответствующими символами из V_p.

Полученная таблица представляет собой таблицу функций переходов g(X) LR(0)-анализатора, причем элементы таблицы, соответствующие переходу в пустое множество состояний, имеют значение ОШИБКА.

Определить функции действия f(a) для всех магазинных символов, каждому из которых соответствует одна строка таблицы. Количество столбцов таблицы f(a) определяется количеством символов в T  {}. Элементы таблицы f(a) определяются следую щим образом.

а) Если магазинному символу Т соответствует единственное вхождение S₀, то в строке, отмеченной символом Т, f() = ДОПУСК, а все остальные элементы – ОШИБКА.

б) Если магазинному символу Т соответствует только одно грамматическое вхождение X_i, являющееся самым правым вхождением в i-е правило вывода грамматики G, то все элемента строки, помеченной Т, имеют значение (СВЕРТКА, i).

в) Если магазинному символу Т соответствует маркер дна магазина  или все грамматические вхождения, представляемые символом Т, не являются самыми правыми в своих правилах, то в строке, отмеченной Т, f() = ошибка, а значения остальных элементов – ПЕРЕНОС.

г) Если множество вхождений, соответствующее магазинному символу Т, содержит начальное вхождение S₀ и хотя бы еще одно вхождение, отличное от которое не является самым правым в своем правиле, то в строке, отмеченной Т, f() = ДОПУСК, а значение всех остальных элементов - ПЕРЕНОС.

Если имеется множество грамматических вхождений, не удовлетворяющих перечисленнымвыше условиям, то G не является LR(0)-грамматикой.

Если построение f(a) закончено успешно, то грамматика является LR(0)-грамматикой, а таблица, полученная объединением таблиц, задающих функции f(a) и g(X) – управляющей таблицей Ʈ LR(0)-анализатора.

Пример 4.3.

Построим управляющую таблицу LR(0)-анализатора для грамматики G₃(рис. 4.8).

О
1. E  E + T
2. E  T
3. T  (E)
4. T  i
Рис. 4.8
пределим пополненную грамматику

G₃’= < T, N  {S}, S, R  { S  E }>.

Вычислим отношение ВПОД для грамматических вхождений грамматики G₃’. Матрица отношения ВПОД изображена на рис. 4.9.

	E₀	E₁	+₁	T₁	T₂	(₃	E₃	)₃	i₄
E₀
E₁			1
+₁				1		1			1
T₁
T₂
(₃		1			1	1	1		1
E₃								1
)3
i₄
	1	1			1	1			1

Рис.4.9

Определим функции переходов g(X).

а) Построим таблицу переходов конечного (недетерминированного) автомата (рис. 4.10,а).

б) Преобразуем недетерминированный автомат в эквивалентный ему детерминированный автомат, таблица переходов которого изображена на рис. 4.10,б.

в) Определим множество магазинных символов (рис. 4.11).

Функции переходов g(Х) LR(0)-анализатора для грамматики G₃ приведены на рис. 4.12.

а)

	E	T	(	)	i	+
E₀
E₁						+₁
+₁		T₁	(₃		i₄
T₁
T₂
(₃	E₁, E₃	T₂	(₃		i₄
E₃				)₃
)₃
i₄
_	E₀, E₁	T₂	(₃		i₄

б)

	E	T	(	)	i	+
{  }	{ E₀, E₁}	{ T₂}	{ (₃}		{ i₄}
{ E₀, E₁}						{ +₁}
{ T₂}
{ (₃}	{ E₁, E₃}	{ T₂}	{ (₃}		{ i₄ }
{ i₄ }
{ +₁}		{ T₁ }	{ (₃}		{ i₄ }
{ E₁, E₃}				{ )₃}		{ +₁}
{ T₁ }
{ )₃}

Рис. 4.10

	{E₀, E₁}	{ E₁, E₃}	{  }	{ T₂}	{ (₃}	{ i₄ }	{ +₁}	{ T₁}	{ )₃}
V_p	E_x	E_y		T₂	(₃	i₄	+₁	T₁	)₃

Рис. 4.11

g(X)	E	T	(	)	i	+
	E_x	T₂	(₃		i₄
E_x						+₁
T₂
(₃	E_y	T₂	(₃		i₄
i₄
+₁		T₁	(₃		i₄
E_y				)₃		+₁
T₁
)₃

Рис. 4.12

Определим функции действия f(a).

Построим таблицу, содержащую по одной строке для каждого магазинного символа и одному столбцу для каждого символа из T  {}. Заполним построенную таблицу в соответствии с п. 4.алгоритма.

Для строки таблицы, отмеченной символом , соответствующее множество грамматических вхождений состоит из единственного символа , поэтому в этой отроке f() = ошибка, а значения остальных элементов – ПЕРЕНОС (см. п.4,в алгоритма).

Множество грамматических вхождений, соответствующих магазинному символу Е_x, содержит два элемента: Е₀ и Е₁. Так как в это множество входит начальное вхождение E₀, а вхождение Е₁ не является самым правым в правиле (1), то в соответствии c п. 4,г алгоритма f() = ДОПУСК, а остальные элементы строки, отмеченные символом Е_x, имеют значение ПЕРЕНОС.

Магазинному символу Т₂ соответствует единственное грамматическое вхождение Т₂, которое является самым правым в правиле вывода (2) грамматики G₃. Следовательно, значение всех элементов строки, помеченной Т₂, – (СВЕРТКА, 2). Поступая подобным образом для остальных строк, получим таблицу функций переходов f(a),приведенную на рис. 4.13.

f(a)	(	)	i	+	
	П	П	П	П
E_x	П	П	П	П	Д
T₂	С,2	С,2	С,2	С,2	С,2
(₃	П	П	П	П
i₄	С,4	С,4	С,4	С,4	С,4
+₁	П	П	П	П
E_y	П	П	П	П
T₁	С,1	С,1	С,1	С,1	С,1
)₃	С,3	С,3	С,3	С,3	С,3

Рис. 4.13

Поскольку при построении f(a) не возникло конфликтных ситуаций, грамматика G₃– LR (0)-грамматика. Объединив функции g(X) и f(a) в одну таблицу, получим управляющую таблицу Ʈ LR(0)-анализатора для грамматики G₃.

<<< < Предыдущая 1 2 34 / 64 5 6 > Следующая >>>

Соседние файлы в папке ВОСХОДЯЩИЕ МЕТОДЫ ОБРАБОТКИ ЯЗЫКОВ

#
01.05.2014263.68 Кб49LR_K_GR.DOC
#
01.05.2014222 б8Методы _восходящие методы обработки языков_ .log