Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
informacionnye_tehnologii.doc
Скачиваний:
13
Добавлен:
08.06.2015
Размер:
1.68 Mб
Скачать

3. Автоматическое порождение письменного текста, определение, этапы, общая структура системы порождения

Системы автоматического порождения текста иначе называют системами синтеза, генерации или создания компьютером текста. Первые такие системы появились в начале 70х годов ХХ века. Существуют самые разные подходы к созданию компьютером текстов. Зависят эти подходы от того, какой текст и с какой целью создаётся. Значительная часть таких систем направлена на создание практических документов (текстов метеосводок, статистических отчетов и инструкций).

Следующая группа таких экспериментальных систем разработана с целью моделирования лингвистических и литературоведческих теорий (создание стихов, сказок и тд). Анализ таких систем показывает, что единой теории компьютерного порождения текстов не существует, однако в процессе текстообразования можно выделить 2 этапа:

- стратегический (что написать) – результатом выполнения этого этапа является смысловое представление будущего текста. Есть много способов смыслового представления, однако все они имеют недостаток – они не опираются на тему будущего текста

- тактический (как написать) – результатом этого этапа является сам порожденный текст. Этот этап имеет ряд проблем:

* что является основной семантико-синтаксической единицей текста (абзац, предложение)

* что должно выступать в качестве лексической единицы текста (слово, словосочетание)

* как лексические единицы связываются в единое содержание

* каковы критерии выбора лексических единиц из базы данных

Система порождения по своей структуре имеет 3 взаимосвязанных компонента:

- оболочка (определяет назначение системы) – определяется, какая система будет создаваться (обучающая или экспертная система). В оболочке содержится вся база знаний. Как правило, такая база знаний состоит из 2х частей:

*нелингвистическая (предметная) – туда заносятся понятия и связи между ними

*лингвистическая – включает различные лингвистические признаки (списки морфем, словарь)

- планировщик – выполняет функции:

*определяет ту информацию, которая должна быть представлена в тексте (информация о выводах и результатах)

*определяет, как эта информация должна быть представлена (в виде стихотворения, в виде рекламного текста и тд)

*определят порядок следования абзацев в тексте

*устанавливает порядок следования синтаксических составляющих в абзаце

*осуществляет языковое оформление связи в предложении (абзаце)

*осуществляет построение синтаксической структуры предложений

*осуществляет выбор лексики

- лингвистический реализатор – обеспечивает грамматическую правильность порожденного текста

4. Виды компьютерных систем автоматического порождения письменного текста

Все существующие системы порождения можно разделить на 2 группы:

- системы, работающие на основе шаблонных технологий – такие системы строятся на основе баз данных, которое содержат уже готовые предложения-шаблоны, которые можно выбирать из баз данных и включать в текст. Системы этой группы работают с очень жесткими типами текстов (тексты деловой документации, характеристики, отчеты, письма, договора)

- порождение на основе лингвистически мотивированных технологий – база данных не содержит шаблонов, текст создается самим компьютером. Компьютер должен знать жанровые и коммуникативные характеристики текстов, а также приемы создания текста. В настоящее время такие системы находятся на стадии разработки или исследования.

1. Этапы процесса создания обучающей системы.

2, Способы использования компьютера в обучении.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]