3. Автоматическое порождение письменного текста, определение, этапы, общая структура системы порождения

Системы автоматического порождения текста иначе называют системами синтеза, генерации или создания компьютером текста. Первые такие системы появились в начале 70х годов ХХ века. Существуют самые разные подходы к созданию компьютером текстов. Зависят эти подходы от того, какой текст и с какой целью создаётся. Значительная часть таких систем направлена на создание практических документов (текстов метеосводок, статистических отчетов и инструкций).

Следующая группа таких экспериментальных систем разработана с целью моделирования лингвистических и литературоведческих теорий (создание стихов, сказок и тд). Анализ таких систем показывает, что единой теории компьютерного порождения текстов не существует, однако в процессе текстообразования можно выделить 2 этапа:

- стратегический (что написать) – результатом выполнения этого этапа является смысловое представление будущего текста. Есть много способов смыслового представления, однако все они имеют недостаток – они не опираются на тему будущего текста

- тактический (как написать) – результатом этого этапа является сам порожденный текст. Этот этап имеет ряд проблем:

* что является основной семантико-синтаксической единицей текста (абзац, предложение)

* что должно выступать в качестве лексической единицы текста (слово, словосочетание)

* как лексические единицы связываются в единое содержание

* каковы критерии выбора лексических единиц из базы данных

Система порождения по своей структуре имеет 3 взаимосвязанных компонента:

- оболочка (определяет назначение системы) – определяется, какая система будет создаваться (обучающая или экспертная система). В оболочке содержится вся база знаний. Как правило, такая база знаний состоит из 2х частей:

*нелингвистическая (предметная) – туда заносятся понятия и связи между ними

*лингвистическая – включает различные лингвистические признаки (списки морфем, словарь)

- планировщик – выполняет функции:

*определяет ту информацию, которая должна быть представлена в тексте (информация о выводах и результатах)

*определяет, как эта информация должна быть представлена (в виде стихотворения, в виде рекламного текста и тд)

*определят порядок следования абзацев в тексте

*устанавливает порядок следования синтаксических составляющих в абзаце

*осуществляет языковое оформление связи в предложении (абзаце)

*осуществляет построение синтаксической структуры предложений

*осуществляет выбор лексики

- лингвистический реализатор – обеспечивает грамматическую правильность порожденного текста

4. Виды компьютерных систем автоматического порождения письменного текста

Все существующие системы порождения можно разделить на 2 группы:

- системы, работающие на основе шаблонных технологий – такие системы строятся на основе баз данных, которое содержат уже готовые предложения-шаблоны, которые можно выбирать из баз данных и включать в текст. Системы этой группы работают с очень жесткими типами текстов (тексты деловой документации, характеристики, отчеты, письма, договора)

- порождение на основе лингвистически мотивированных технологий – база данных не содержит шаблонов, текст создается самим компьютером. Компьютер должен знать жанровые и коммуникативные характеристики текстов, а также приемы создания текста. В настоящее время такие системы находятся на стадии разработки или исследования.

1. Этапы процесса создания обучающей системы.

2, Способы использования компьютера в обучении.

<<< < Предыдущая 1 2 34 / 44

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
08.06.2015835.58 Кб257IKP Texts for analysis.doc
#
08.06.2015798.21 Кб74IKP Theory.doc
#
18.11.2019113.26 Кб4IMG.doc
#
08.06.201525.6 Кб14Indefinite or Perfect-ДЛЯ-СЛУШАТЕЛЕЙ.doc
#
28.03.2016335.36 Кб8infamias методичка 4 часть.doc
#
08.06.20151.68 Mб14informacionnye_tehnologii.doc
#
08.06.2015109.02 Кб16Informatsionnye_tekhnologii.docx
#
18.12.201872.18 Кб5Inostrannye_investitsii.docx
#
08.06.2015210.94 Кб17Introduction .doc
#
08.06.2015109 Кб12Introduction_To_The_Confidence_Gap.pdf
#
08.06.20154.26 Mб14IPSC_handbook2013_PH.pdf