Отчет по программе pc-kimmo
При изучении морфологического анализатора «PC-KIMMO» перед нами стояла задача познакомиться с работой программы и её возможностями, выбрать одну из групп отклоняющихся глаголов испанского языка и провести ее морфологический анализ в одном времени средствами данной программы.
«PC-KIMMO» позволяет описывать морфологию языка и осуществляет разложение словоформ на морфемы и генерацию словоформ на основе правил, записанных в матрицу.
Для нашей работы мы выбрали анализ V группы отклоняющихся глаголов в настоящем времени. Особенность данной группы состоит в том, что «c» переходит в «zc» в первом лице единственного числа (перед «o»). Для анализа мы взяли глаголы первого спряжения agradecer, abastecer, amanecer.
Для работы с программой необходимо было создать несколько файлов:
lexicon.lex (файл лексикона),
verb.lex и end.lex (содержат инфинитив глагола и окончания 1,2,3 лица ед. и мн. ч. в настоящем времени),
rules.rul (содержащий правила),
esp.fs,
esp.fg,
esp.fr,
comands.tak, который содержит заранее прописанную последовательность команд и во многом облегчает дальнейшую работу.
Нужно заметить, что файлы с расширением *.fg, *.fr, *.fs, *.lex, *.rul и *.tak мы создаем сами.
Содержание файла esp.fg
agradecer+er
agradecer +o
agradecer +es
agradecer +e
agradecer+emos
agradecer+Eis
agradecer+en
abastecer+er
abastecer+o
abastecer+es
abastecer+e
abastecer+emos
abastecer+Eis
abasrecer+en
amanecer+er
amanecer+o
amanecer+es
amanecer+e
amanecer +emos
amanecer+Eis
amanecer+en
Содержание файла esp.fr
agradecer
agradezco
agradeces
agradece
agradecemos
agradecEis
agradecen
abastecer
abastezco
abasteces
abastece
abastecemos
abastecEis
abastecen
amanecer
amanezco
amaneces
amanece
amanecemos
amanecEis
amanecen
Содержание файла esp.fs
agradecer +INF
agradecer +PRS1SG
agradecer +PRS2SG
agradecer +PRS3SG
agradecer +PRS1PL
agradecer +PRS2PL
agradecer +PRS3PL
abastecer +INF
abastecer +PRS1SG
abastecer +PRS2SG
abastecer +PRS3SG
abastecer +PRS1PL
abastecer +PRS2PL
abastecer +PRS3PL
amanecer +INF
amanecer +PRS1SG
amanecer +PRS2SG
amanecer +PRS3SG
amanecer +PRS1PL
amanecer +PRS2PL
amanecer +PRS3PL
Содержание файла rules.rul
ALPHABET
;lexical (upper) and surface (lower) characters:
b c d f g h j k l m n p q r s t v w x y z a e i o u ' - .
sh ch zc er ;digraphs
B C D F G H J K L M N P Q R S T V W X Y Z A E I O U
;lexical (upper) only characters:
` +
NULL 0
ANY @
BOUNDARY #
SUBSET CNsib s x z sh ch ;sibilant consonants
RULE
"Defaults 1" 1 33
b c d f g h j k l m n p q r s t v w x y z sh ch a e i o u ' - ` + @
b c d f g h j k l m n p q r s t v w x y z sh ch a e i o u ' - 0 0 @
1: 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
RULE
"Defaults 2" 1 30
B C D F G H J K L M N P Q R S T V W X Y Z A E I O U . @ er zc
B C D F G H J K L M N P Q R S T V W X Y Z A E I O U . @ er zc
1: 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
RULE "FGFH" 4 5
@ c er + о
@ zc 0 0 o
1: 1 2 0 0 0
2: 0 0 3 0 0
3: 0 0 0 4 0
4: 0 0 0 0 4
END
Содержание файла lexicon.lex
ALTERNATION Root V
ALTERNATION Infl INFL ;inflection
ALTERNATION End End
FEATURES 1 2 3 sg pl INF
FIELDCODE lf U ;lexical item
FIELDCODE lx L ;sublexicon
FIELDCODE alt A ;alternation
FIELDCODE fea F ;features
FIELDCODE gl G ;gloss (root)
INCLUDE end.lex ;file of endings
INCLUDE verb.lex ;file of verbs
END
Содержание файла verb.lex
\lf agradecer
\lx V
\alt Infl
\fea
\gl V(agradecer)
\syn
\lf abastecer
\lx V
\alt Infl
\fea
\gl V(abastecer)
\syn
\lf amanecer
\lx V
\alt Infl
\fea
\gl V(amanecer)
\syn
Содержание файла end.lex
\lf 0
\lx INITIAL
\alt Root
\fea
\gl [
\syn
\lf +er
\lx INFL
\alt End
\fea INF
\gl +INF
\syn +INF
\lf +o
\lx INFL
\alt End
\fea 1 sg
\gl +PRS1SG
\syn +PRS1SG
\lf +es
\lx INFL
\alt End
\fea 2 sg
\gl +PRS2SG
\syn +PRS2SG
\lf +e
\lx INFL
\alt End
\fea 3 sg
\gl +PRS3SG
\syn +PRS3SG
\lf +emos
\lx INFL
\alt End
\fea 1 pl
\gl +PRS1PL
\syn +PRS1PL
\lf +Eis
\lx INFL
\alt End
\fea 2 pl
\gl +PRS2PL
\syn +PRS2PL
\lf +en
\lx INFL
\alt End
\fea 3 pl
\gl +PRS3PL
\syn +PRS3PL
\lf 0
\lx End
\alt #
\fea
\gl ]
\syn
Содержание файла commands.tak
load rules rules.rul
load lexicon lexicon.lex
Программа выполняет действия в соответствии с правилами, которые мы ей задаем. Для выполнения нашей работы мы построили следующую матрицу:
@ c er + о
@ zc 0 0 o
1: 1 2 0 0 0
2: 0 0 3 0 0
3: 0 0 0 4 0
4: 0 0 0 0 4
Результатом нашей работы стало то, что программа могла показывать на выходе верную словоформу (спряжение выбранных нами глаголов в настоящем времени изъявительного наклонения).
Таким образом, в ходе работы мы ознакомились с программой PC-KIMMO, научились проводить морфологический. Также мы освоили принцип построения конечных автоматов, что требовалось для правильной и успешной работы заданных нами в программе правил. В целом, можно сказать, что данная программа, несмотря на некоторые недочеты, полезна и может существенно облегчить морфологический анализ словоформ.