Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
SIT.doc
Скачиваний:
36
Добавлен:
27.10.2018
Размер:
275.97 Кб
Скачать

14. Типы информационных систем, в которых используются базы данных (бд). Автоматизированные банки данных (абд).

(данные, т.е. показатели, которые характеризуют определенный объект, объединяются в записи, записи в файлы, файлы в БД, БД в АБД.)

БД – хранимые в машинной памяти структурированные данные вместе с их описанием. БД создаются по отдельным предметным областям.

Информационные системы, использующие БД:

1) информационно-поисковые системы (ИПС): для извлечения сведений, отвечающих конкретному поисковому критерию, оформленному в виде запроса. ИПС делятся на:

а) фактографические (получение конкретных, часто количественных данных), e.g. Сколько статей?

б) документальные (более расширенная, текстовая информация), e.g. Какие статьи?

в) документально-фактографические.

2) системы обработки данных (СОД): запрос требующий обработки некоторых данных, т.е. СОД позволяет извлекать и обрабатывать сведения, e.g. автоматическое начисление % в банке.

БД – хранимые в памяти компьютера данные по нескольким предметным областям.

АБД – определенным образом организованная совокупность БД для решения определенных информационных задач. Примеры: DIALOG (США), объем – 350БД, текстовая и текстово-числовая информация по сельскому хоз-ву, экономике и т.д.; IPSHARP (Канада), объем – 130БД, статистич. финансово-экономическая информация.

Отличительные особенности АБД:

1) большие объемы

2) сложная структура хранимой информации

3) возможность многоаспектной обработки

15. Базовые информационные технологии лингвистических научных исследований.

Теоретическую основу ИТ составляют важнейшие понятия и законы информатики, само понятие информатики и понятие информации.

Информация (И) (лат. informatio – разъяснение, изложение) – это определенным образом связанные сведения, данные, понятия, отраженные в нашем сознании.

Информатика – наука о законах и методах получения, хранения, передачи, распространения, преобразования и использования И в естественных и искусственных системах с применением К.

Лингвистическая информатика – наука, изучающая законы и методы организации и переработки с помощью К лингвистической информации.

Задачи лингвистической информатики:

1. исследование стр-ры слов, словосочетаний, предложений, текста

2. выявление и изучение правил и методов объединения нижестоящих яз единиц в вышестоящие

3. изучение и разработка правил перевода предложений и текста в свете автоматич. переработки текста

4. создание способов построения автом. или машин. аннотаций и рефератов

разработка путей обучения языкам с пом. К.

ИТ – совокупность законов, методов и средств хранения, распространения и обработки информации с помощью К. (= комп. технологии)

Основные ИТ в лингвистике:

  1. автоматическое создание корпусов текстов поэтов, писателей (для исследований)

  2. автоматическое определение авторства неизвестного текста

  3. автоматическое определение значения многозначного слова (по контексту)

  4. создание автоматических словарей

  5. разработка автоматического синтаксического анализ предложения

  6. автоматическое индексирование, аннотирование и реферирование текста

  7. перевод текста

  8. понимание текста (системы распознавания и синтеза речи)

  9. автоматическое порождение нового текста

  10. автоматическое чтение текста (системы сканир. и распознав текста)

Корпус текстов – совокупность текстов, считающаяся достаточной и представительная для данного языка (диалекта либо любого иного подмножества языка), предназначенная для разных типов лингвистического анализа.

Индексирование- (1) определение темы текста или (2) процесс выбора ключевых слов (=дескрипторов, индикаторов) для включения в поисковый образ документа.

Автоматическое реферирование/аннотирование – составление Р/А с помощью компьютера.

Р – связный текст, кот. кратко выражает центральную тему первичного документа и цель, методы, рез-ты исследования.

А – наикратчайшее изложение содержания первичного документа, дающее представление о его теме.

Система автоматического чтения – прикладная программа, позволяющая преобразовывать текст с бумажного носителя в электронный текстовый файл, который далее можно обрабатывать с помощью систем машинного перевода, аннотирования, реферирования и других прикладных программ.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]