Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекція 13.doc
Скачиваний:
3
Добавлен:
05.12.2018
Размер:
145.92 Кб
Скачать

3.24. Можливості інформаційно-пошукових систем

1. Пошук за словом, усіканнями і словоформами

Усі пошукові системи забезпечують пошук хоча б по одному слову. Засоби навігації в Інтернеті, що не забезпечують такого пошуку, називаються інакше — каталогами, колекціями посилань і т. ін. Інакше справа стоїть з усіканнями слів. Наприклад, система InfoSeek розглядає всі слова запиту як праві усікання. У деяких відомих системах можливість пошуку за усіканням просто не реалізована (наприклад, Lycos). Однак у більшості систем (наприклад, AltaVista, Rambler) для маскування правого усікання слова досить поставити символ «*».

Пошук за словоформами є результатом серйозного лінгвістичного аналізу і реалізований, наприклад, у двох російськомовних системах „Апорт” і Яндекс. У системі „Апорт” граматична форма слова в запиті особливого значення не має — воно зберігається в базі даних у всіх своїх формах. У цій системі запит „ребенок шел” еквівалентно запитові „дети идут”.

2. Пошук по фрагментах тексту (строгим словосполученням)

Багато систем здатні реалізовувати контекстний пошук, укладеної в лапках фрази (наприклад, AltaVista, Lycos, InfoSeek і т. ін.). Така здатність — це реалізація неявно зазначених за допомогою лапок операторів контекстної близькості.

3. Використання логічних операторів

Для введення запитів зі складною логікою, як правило, потрібне використання булевих і контекстних операторів, дужок, і т. ін. Для більшості випадків (до 75% як було вже сказано) цього не потрібно. Тому в деякіх інформаційно-пошукових системах створено по два пошукових інтерфейси — простий (за замовчуванням) і розширений (який називається у різних системах детальним, могутнім або професійним). Цим шляхом пішли, наприклад, AltaVista, Lycos, InfoSeek, Rambler. В усіх розглянутих системах реалізовані булеві опе­рації AND, OR і NOT, а також робота з дужками. Однак у двох з них — AlLaVista і Excite — оператор-NOT записується у вигляді „AND NOT”, у такий спосіб підкреслюється його бінарність (у математичній логіці оператор NOT у чистому вигляді унарний та не може відноситися до двох операндів).

4. Використання операторів контекстної близькості

Більшість професійних пошукових систем забезпечує виконання операцій контекстної близькості. Наприклад, у системі Lycos функції контекстної близькості одержали найбільший розвиток і реалізовані за допомогою чотирьох операторів: ADJ, NEAR, FAR, BEFORE.

ADJ забезпечує близькість двох слів у тексті в будь-якому порядку.

NEAR дозволяє знаходити документи, у яких слова-операнди віддалені не більше ніж на 25 слів.

FAR — оператор, протилежний за змістом операторові NEAR, він виключає близькість термінів запиту в межах 25 слів тексту документа.

BEFORE — схожий на оператор ADJ, тільки з урахуванням порядку розташування термінів у тексті.

Наприклад, оригінальне вирішене питання контекстної близькості в інформаційно-пошуковій системі Rambler. За бажання мінімізувати відстань між пошуковими термінами, використовується службове слово „$пеаг:”, за яким розташовані два операнда — значення самих слів. У системі „Апорт” інтелектуальній обробці піддаються словосполучення в лапках. Наприклад, запит „яблука на снігу” еквівалентний запитам „яблука і сніг”, „яблука під снігом”, „яблуко-сніг”.