Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
отчёт Колосова.doc
Скачиваний:
5
Добавлен:
18.11.2019
Размер:
462.85 Кб
Скачать

Отчет по программе pc-kimmo

При изучении морфологического анализатора «PC-KIMMO» перед нами стояла задача познакомиться с работой программы и её возможностями, выбрать одну из групп отклоняющихся глаголов испанского языка и провести ее морфологический анализ в одном времени средствами данной программы.

«PC-KIMMO» позволяет описывать морфологию языка и осуществляет  разложение словоформ на морфемы и генерацию словоформ  на основе правил, записанных в матрицу.

Для нашей работы мы выбрали анализ V группы отклоняющихся глаголов в настоящем времени. Особенность данной группы состоит в том, что «c» переходит в «zc» в первом лице единственного числа (перед «o»). Для анализа мы взяли глаголы первого спряжения agradecer, abastecer, amanecer.

Для работы с программой необходимо было создать несколько файлов:

  • lexicon.lex (файл лексикона),

  • verb.lex и end.lex (содержат инфинитив глагола и окончания 1,2,3 лица ед. и мн. ч. в настоящем времени),

  • rules.rul (содержащий правила),

  • esp.fs,

  • esp.fg,

  • esp.fr,

  • comands.tak, который содержит заранее прописанную последовательность команд и во многом облегчает дальнейшую работу.

Нужно заметить, что файлы с расширением *.fg, *.fr, *.fs, *.lex, *.rul и *.tak мы создаем сами.

Содержание файла esp.fg

agradecer+er

agradecer +o

agradecer +es

agradecer +e

agradecer+emos

agradecer+Eis

agradecer+en

abastecer+er

abastecer+o

abastecer+es

abastecer+e

abastecer+emos

abastecer+Eis

abasrecer+en

amanecer+er

amanecer+o

amanecer+es

amanecer+e

amanecer +emos

amanecer+Eis

amanecer+en

Содержание файла esp.fr

agradecer

agradezco

agradeces

agradece

agradecemos

agradecEis

agradecen

abastecer

abastezco

abasteces

abastece

abastecemos

abastecEis

abastecen

amanecer

amanezco

amaneces

amanece

amanecemos

amanecEis

amanecen

Содержание файла esp.fs

agradecer +INF

agradecer +PRS1SG

agradecer +PRS2SG

agradecer +PRS3SG

agradecer +PRS1PL

agradecer +PRS2PL

agradecer +PRS3PL

abastecer +INF

abastecer +PRS1SG

abastecer +PRS2SG

abastecer +PRS3SG

abastecer +PRS1PL

abastecer +PRS2PL

abastecer +PRS3PL

amanecer +INF

amanecer +PRS1SG

amanecer +PRS2SG

amanecer +PRS3SG

amanecer +PRS1PL

amanecer +PRS2PL

amanecer +PRS3PL

Содержание файла rules.rul

ALPHABET

;lexical (upper) and surface (lower) characters:

b c d f g h j k l m n p q r s t v w x y z a e i o u ' - .

sh ch zc er ;digraphs

B C D F G H J K L M N P Q R S T V W X Y Z A E I O U

;lexical (upper) only characters:

` +

NULL 0

ANY @

BOUNDARY #

SUBSET CNsib s x z sh ch ;sibilant consonants

RULE

"Defaults 1" 1 33

b c d f g h j k l m n p q r s t v w x y z sh ch a e i o u ' - ` + @

b c d f g h j k l m n p q r s t v w x y z sh ch a e i o u ' - 0 0 @

1: 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

RULE

"Defaults 2" 1 30

B C D F G H J K L M N P Q R S T V W X Y Z A E I O U . @ er zc

B C D F G H J K L M N P Q R S T V W X Y Z A E I O U . @ er zc

1: 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

RULE "FGFH" 4 5

@ c er + о

@ zc 0 0 o

1: 1 2 0 0 0

2: 0 0 3 0 0

3: 0 0 0 4 0

4: 0 0 0 0 4

END

Содержание файла lexicon.lex

ALTERNATION Root V

ALTERNATION Infl INFL ;inflection

ALTERNATION End End

FEATURES 1 2 3 sg pl INF

FIELDCODE lf U ;lexical item

FIELDCODE lx L ;sublexicon

FIELDCODE alt A ;alternation

FIELDCODE fea F ;features

FIELDCODE gl G ;gloss (root)

INCLUDE end.lex ;file of endings

INCLUDE verb.lex ;file of verbs

END

Содержание файла verb.lex

\lf agradecer

\lx V

\alt Infl

\fea

\gl V(agradecer)

\syn

\lf abastecer

\lx V

\alt Infl

\fea

\gl V(abastecer)

\syn

\lf amanecer

\lx V

\alt Infl

\fea

\gl V(amanecer)

\syn

Содержание файла end.lex

\lf 0

\lx INITIAL

\alt Root

\fea

\gl [

\syn

\lf +er

\lx INFL

\alt End

\fea INF

\gl +INF

\syn +INF

\lf +o

\lx INFL

\alt End

\fea 1 sg

\gl +PRS1SG

\syn +PRS1SG

\lf +es

\lx INFL

\alt End

\fea 2 sg

\gl +PRS2SG

\syn +PRS2SG

\lf +e

\lx INFL

\alt End

\fea 3 sg

\gl +PRS3SG

\syn +PRS3SG

\lf +emos

\lx INFL

\alt End

\fea 1 pl

\gl +PRS1PL

\syn +PRS1PL

\lf +Eis

\lx INFL

\alt End

\fea 2 pl

\gl +PRS2PL

\syn +PRS2PL

\lf +en

\lx INFL

\alt End

\fea 3 pl

\gl +PRS3PL

\syn +PRS3PL

\lf 0

\lx End

\alt #

\fea

\gl ]

\syn

Содержание файла commands.tak

load rules rules.rul

load lexicon lexicon.lex

Программа выполняет действия в соответствии с правилами, которые мы ей задаем. Для выполнения нашей работы мы построили следующую матрицу:

@ c er + о

@ zc 0 0 o

1: 1 2 0 0 0

2: 0 0 3 0 0

3: 0 0 0 4 0

4: 0 0 0 0 4

Результатом нашей работы стало то, что программа могла показывать на выходе верную словоформу (спряжение выбранных нами глаголов в настоящем времени изъявительного наклонения).

Таким образом, в ходе работы мы ознакомились с программой PC-KIMMO, научились проводить морфологический. Также мы освоили принцип построения конечных автоматов, что требовалось для правильной и успешной работы заданных нами в программе правил. В целом, можно сказать, что данная программа, несмотря на некоторые недочеты, полезна и может существенно облегчить морфологический анализ словоформ.