Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
S-13.DOC
Скачиваний:
2
Добавлен:
10.11.2019
Размер:
542.72 Кб
Скачать

13.3. Дескрипторна інформаційно-пошукова мова та принципи її побудови

У сучасних АIПС дескрипторна мова експлуатується в двох варіантах:

1. Обробка документів і запитів за допомогою інформаційно-пошукового тезаурусу.

2. Безтезаурусний ввід і пошук документів.

При використанні дескрипторної мови основний зміст запиту чи документа виражається у вигляді деякої сукупності слів чи словосполучень природної мови. Слова та словосполучення є імена­ми деяких класів понять. Слово чи словосполучення, яке входить до пошукового образу, задає координати документа в багатови­мірному просторі ознак.

Для координатного індексування документів чи запитів можна як лексичні одиниці IПМ використовувати слова, які безпосередньо вибираються з індексованих текстів. Такі слова та словосполучення називаються ключовими словами.

Як уже зазначалося, пошук в IПС зводиться до формального порівняння пошукового образу документа та пошукового розпорядження (запиту).

Проте простий вибір ключових слів із тексту для послівного порівняння ПОБ і ПР є складним через наступні причини:

1) можливе різне написання одних і тих самих слів;

2) cеред ключових слів є дуже багато синонімів та омонімів;

3) ключові слова не визначають родово-видові відношення між словами.

Наприклад, темою запиту є отримання документації про на­півпровідникову продукцію, що виготовляється на заводі. При виконанні запиту документація, що містить інформацію про транзистори, не буде видана як відповідь на запит, незважаючи на те, що поняття «напівпровідник» охоплює вужче поняття — «тран­зистор».

Для усунення цих недоліків при розробці дескрипторної мови виконується спеціальний лексикограматичний контроль, будуються спеціальні словники, схеми, таблиці, які дають змогу виразити парадигматичні відношення між термінами індексування. Для дескрипторної мови розробляється спеціальний синтаксис.

Лексикографічний контроль полягає в тому, що всі ключові слова зводяться до нормального вигляду, тобто до одної форми написання і повного усунення синонімії, омонімії та різного роду багатозначностей за допомогою спеціального нормативного словника. У цьому словнику в єдиній морфологічній формі перелічені всі ключові слова. Зі списку ключових слів вибираються слова, які в межах даної IПМ є синонімами. Ці ключові слова групуються в класи умовної еквівалентності (парадигми). Iз кожної такої групи вибирається одне слово чи словосполучення, яке є семантичною домінантою групи, тобто найповніше визначає зміст слів від­по­відної групи. Ці слова стають дескрипторами, тобто лексичними одиницями IПМ. Звідси й походить назва «дескрипторна мова».

Отже, дескриптори — необхідні для координатного індексу­вання документів та інформаційних запитів нормативні ключові слова, які відібрані з основного словникового складу природної мови так, аби серед них не було омонімів, синонімів та багатозначності.

Дескрипторною називається спеціалізована інформаційно-пошукова мова, словниковий склад якої становлять дескриптори, а граматика — способи побудови пошукових образів та пошукових розпоряджень координацією відповідних дескрипторів.

Словниковий склад IПМ можна розбити на дві частини:

1. Основний словниковий склад, до якого належать дескриптори однієї галузі.

2. Ключові слова, які позначають чи виражають власні імена, вузькі чи нові поняття, специфічні найменування, кількісні характеристики і т.ін.

Дескриптори та ключові слова з певної галузі записуються в алфавітному порядку і утворюють нормативний словник.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]