Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Бакалавр_Рамки_07.doc
Скачиваний:
10
Добавлен:
27.03.2015
Размер:
1.22 Mб
Скачать

Содержание

Введение…………………………………………………………………….................................4

1 Разработка и анализ технического задания………………………………………………….5

1.1 Исследование предметной области..………………………………………………….….5

1.1.1 Обзор существующих методов генерации текста…………………………..........5

1.1.1.1 Шаблонные системы………………………………………………….…...5

1.1.1.2 Генерация текстов на основе базы данных…………………………..…..6

1.1.1.3 Генерация текстов из семантического представления…………………..8

1.1.2 Морфологический разбор слов……………………………………………………8

1.2 Разработка технического задания……………………………………………….….…...10

1.2.1 Цель и назначение разработки………………………………………….………...10

1.2.2 Область применения……………………………………………………….….......10

1.2.3 Функциональные требования……………………………………………….…....10

1.2.4 Количественные требования……………………………………………….….…11

1.2.5 Требования совместимости…………………………………………....…..…..…11

1.2.6 Аппаратные требования……………………………………………………….…11

1.2.7 Требования к интерфейсу……………………………………………..……….…11

1.3. Анализ технического задания………………………………………………………......12

1.3.1 Анализ требований технического задания………………………………….…..12

1.3.2 Метод порождения текста на основе цепей Маркова……………………..…...12

1.3.3 Выбор средств реализации…………………………………………………...…..13

2 Разработка программы………………………………………………………………….…....14

2.1 Разработка алгоритма генерации текста………………………………………….....…14

2.2 Разработка алгоритма морфологического разбора……………………………..…….15

2.3 Разработка архитектуры……………………………………………………………......19

2.4 Реализация программы……………………………………………………………....…21

2.4.1 Основной поток……………………………………………………………..…....21

2.4.2 Разбор модулей……………………………………………………………..……22

2.4.2.1 Модуль генерации текста…………………………………………..…....22

2.4.2.2 Модуль морфологического разбора и словарь синонимов……..……23

2.4.3 Соглашение об именовании классов, переменных и методов……..…..25

3 Расчеты и оценки качества получаемого текста……………………………………………26

4 Разработка руководства пользователя………………………………………………………28

5 Разработка руководства системного администратора…………………………………..…30

Заключение…………………………………………………………………………………..….32

Список литературы………………………………………………………………………..……33

Приложение А Исходный код некоторых функций……………………………………..…...34

ВКР-НГТУ-230200.62-(07-КТ-2)-28-2011 ПЗ

Лист

3

Изм.

Лист

докум.

Подп.

Дата

1 Разработка и анализ технического задания

1.1 Исследование предметной области

1.1.1 Обзор существующих методов генерации текста

В настоящее время письменный текст на естественном языке (ЕЯ) широко распространен как средство коммуникации пользователя с компьютерными системами. Большая часть программных приложений, которые выдают тексты на естественном языке, работает с информацией как со строкой символов. Они манипулируют готовыми предложениями и словосочетаниями как строительными блоками будущего текста. Это - шаблонные технологии. Шаблонные технологии относительно просты и надежны и находят широкое промышленное применение. Главная особенность этих технологий состоит в том, что содержание будущего текста представлено в них в виде фрагментов текста.

Другой вид систем работает с содержанием будущего текста, представленном в виде данных нетекстовой природы: баз данных, баз знаний, семантических и  формальных языков. В этом случае для создания текста  системе необходимы знания структуры содержания и знания об устройстве генерируемого  текста, а также сложные лингвистические знания, которые позволяют выразить это содержание языковыми средствами.

Это - лингвистически мотивированные (ЛМ) технологии. В настоящее время они еще находятся в стадии исследования. ЛМ технологии связаны с изучением жанровых и коммуникативных характеристик текстов, риторических приемов организации содержания текста, языковых средств выражения связности текста, формализацией грамматики и лексических  описаний. Они не могут быть буквально повторены автоматической системой. Поэтому, хотя ЛМ технологии опираются на определенные соответствия неязыковых знаний и языковых средств, они также активно используют и шаблонные технологии для решения конкретных проблем.