3. Автоматическое порождение письменного текста, определение, этапы, общая структура системы порождения
Системы автоматического порождения текста иначе называют системами синтеза, генерации или создания компьютером текста. Первые такие системы появились в начале 70х годов ХХ века. Существуют самые разные подходы к созданию компьютером текстов. Зависят эти подходы от того, какой текст и с какой целью создаётся. Значительная часть таких систем направлена на создание практических документов (текстов метеосводок, статистических отчетов и инструкций).
Следующая группа таких экспериментальных систем разработана с целью моделирования лингвистических и литературоведческих теорий (создание стихов, сказок и тд). Анализ таких систем показывает, что единой теории компьютерного порождения текстов не существует, однако в процессе текстообразования можно выделить 2 этапа:
- стратегический (что написать) – результатом выполнения этого этапа является смысловое представление будущего текста. Есть много способов смыслового представления, однако все они имеют недостаток – они не опираются на тему будущего текста
- тактический (как написать) – результатом этого этапа является сам порожденный текст. Этот этап имеет ряд проблем:
* что является основной семантико-синтаксической единицей текста (абзац, предложение)
* что должно выступать в качестве лексической единицы текста (слово, словосочетание)
* как лексические единицы связываются в единое содержание
* каковы критерии выбора лексических единиц из базы данных
Система порождения по своей структуре имеет 3 взаимосвязанных компонента:
- оболочка (определяет назначение системы) – определяется, какая система будет создаваться (обучающая или экспертная система). В оболочке содержится вся база знаний. Как правило, такая база знаний состоит из 2х частей:
*нелингвистическая (предметная) – туда заносятся понятия и связи между ними
*лингвистическая – включает различные лингвистические признаки (списки морфем, словарь)
- планировщик – выполняет функции:
*определяет ту информацию, которая должна быть представлена в тексте (информация о выводах и результатах)
*определяет, как эта информация должна быть представлена (в виде стихотворения, в виде рекламного текста и тд)
*определят порядок следования абзацев в тексте
*устанавливает порядок следования синтаксических составляющих в абзаце
*осуществляет языковое оформление связи в предложении (абзаце)
*осуществляет построение синтаксической структуры предложений
*осуществляет выбор лексики
- лингвистический реализатор – обеспечивает грамматическую правильность порожденного текста
4. Виды компьютерных систем автоматического порождения письменного текста
Все существующие системы порождения можно разделить на 2 группы:
- системы, работающие на основе шаблонных технологий – такие системы строятся на основе баз данных, которое содержат уже готовые предложения-шаблоны, которые можно выбирать из баз данных и включать в текст. Системы этой группы работают с очень жесткими типами текстов (тексты деловой документации, характеристики, отчеты, письма, договора)
- порождение на основе лингвистически мотивированных технологий – база данных не содержит шаблонов, текст создается самим компьютером. Компьютер должен знать жанровые и коммуникативные характеристики текстов, а также приемы создания текста. В настоящее время такие системы находятся на стадии разработки или исследования.
1. Этапы процесса создания обучающей системы.
2, Способы использования компьютера в обучении.