Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
5 КТ.doc
Скачиваний:
52
Добавлен:
08.02.2016
Размер:
6.6 Mб
Скачать

5.4. Організація пошуку правової інформації в Інтернет

5.4.1. Стратегії пошуку інформації в Інтернет

Сьогодні Інтернет — це найбільший світовий інформаційний ресурс, що містить практично всю інформацію, якою може зацікавитись людина. Але популярне порівняння Мережі з величезною бібліотекою неправомірне через відсутність будь-якої систематизації її ресурсів і хаотичне стрімке збільшення кількості посилань. Тому «потенціал для вирішення задач» Інтернет (корисність інформації, одержаної за її допомогою) є досить низьким — користувач не може розраховувати на одержання інформації, яка буде водночас задовольняти три базові вимоги — своєчасність, достовірність, повнота. Отже, використання Інтернет з професійною метою становить проблему, яка постійно ускладнюється.

Бібліотеки — цифрові і звичайні

У дискусіях щодо цифрових бібліотек, доступних через локаль­ні або глобальні мережі, часто приймаються припущення, які при ближ­чому розгляді можна визначити як хибні:

  • оцифровані матеріали з часом замінять інші форми подання інформації. Можна сказати, що нові технології створюють і запов­нюють нові ніші, але це тільки невелика частка тих інфор­маційних ресурсів, які людство створило протягом своєї історії;

  • інформація в Інтернет є адекватною заміною послуг звичайних бібліотек. Насправді величезна кількість публікацій в Інтернет — це реклама і «самвидав», який не вимагає ухвали рецен­зента, редактора, видавця або бібліотекаря, і має досить ефемерний характер. Користувач Мережі має самостійно визначати достовірність і повноту одержаної інформації;

  • каталоги інформаційних ресурсів малоцінні, якщо останні не доступні в режимі on-line. Але першим кроком у процесі пошуку інформації є визначення її місцезнаходження, при цьому можуть бути корисні каталоги, індекси, анотації та інші описи як електронних, так і звичайних ресурсів.

Слід зазначити, що звичними вже стали проекти, які передбачають певне поєднання можливостей звичайних бібліотек та Інтернет. Наприклад, Національна бібліотека України ім. Вернадського (http://www.nbuv.gov.ua/) пропонує скористатися електронним каталогом. Для кожного знайденого об’єкта (книги, дисертації та ін.) у списку, крім звичайних реквізитів, указуються індекс рубрикатора і шифр зберігання у бібліотеці, що полегшує подальшу роботу. Електронний каталог бібліотеки КНЕУ дає змогу здійснити пошук у базах даних BOOKS — «Книги бібліотеки», APEL — «Статті з періодичних видань бібліотеки», WORK — «Праці викладачів КНЕУ», AUNTD — «Законодавчі та нормативні документи». Існують і проекти переведення бібліотек у цифровий формат для надання можливості користувачам безкоштовно шукати інформацію і безкоштовно або за невелику платню користуватися нею. Найбільш масштабним українським проектом такого роду є створення Національної архівної інформаційної системи «Архівна та рукописна Україніка».

З іншого боку, електронні періодичні видання Мережі часто перетворюються на е-бібліотеки — стирається межа між списком розсилки з архівом, мережним журналом, тематичним Web-сайтом, літературним клубом і повномасштабною бібліотекою.

У цьому контексті вводиться поняття «медіа-компетент­ність», яке позначає систему навиків пошуку в середовищі Інтернет і застосування інформації з раціональним рівнем потенціалу вирішення задач. Web-серфінг — заняття захоплююче, але малопродуктивне. Тому для пошуку потрібної інформації користувач має звертатись до спеціальних сервісів.

Існують три базові стратегії, які можуть бути використані:

  1. перегляд пошукових каталогів — найчастіше це неефектив­на стратегія, яка дає безсистемні результати. Пошук здійснюється кроками, через вибір загальної категорії, потім — підкатегорії і т. д. за існуючою ієрархією. Складність такого пошуку полягає в тому, що користувач має визначити, до якої категорії належить його тема, а за відсутності стандартів кожен каталог має свою систематику і специфічне наповнення;

  2. перехід за гіперпосиланнями від стартової сторінки. Ефективність цієї стратегії залежить від вибору початкового сайту або Web-сторінки. Більшість мегапорталів мають рейтинги сайтів, позначені як «Top» або «Cool». Такі рейтинги створюються за кіль­кістю відвідувань їх користувачами. Але інформаційні потреби різ­них користувачів не збігаються, тому до таких рейтингів слід ставитись з обережністю. Водночас, як показує практика, більшість користувачів одного профілю мають однакові інформаційні потреби, а тому відвідують одні й ті самі тематичні сторінки, які можна розглядати як спеціалізований вхід до Інтернет. Тим, хто починає пошук правової інформації, можна, зокрема, рекомендувати сайт Верховної Ради України «Закони та підзаконні акти України в Інтернет» — http://www.rada.gov.ua/ (див. підрозд. 5.5); «Інформаційний бізнес-портал в Інтернет — LIGA ONLINE» —http://www.liga.kiev.ua;«Нормативні акти України — он-лайн» — http://www.nau.kiev.ua/;

  1. пошук за допомогою пошукових систем. На відміну від каталогів, такий пошук не обмежується окремою категорією. Ця стратегія може бути використана і для пошуку першої сторінки.

Використовуючи пошукові системи Інтернет, потрібно враховувати такі фактори, що впливають на результативність пошуку:

  • кожна пошукова система Мережі має свою спеціалізацію;

  • пошук здійснюється не за повними текстами документів, а за їх пошуковими образами, при цьому кожна система має оригінальний механізм роботи з ключовими словами. Зокрема, якщо база даних системи невелика, то до неї записується більше термінів, в іншому разі пошуковий образ документа відбираються «найвагоміші» ключові слова;

База індексів пошукової системи — поле конкурентної боротьби

Власники (автори) Web-серверів зацікавлені в тому, щоб їх URL-адреси були відомі пошуковим системам, оскільки це прямий шлях до кінцевих користувачів. Крім звичайних прийомів при цьому застосовуються і нетрадиційні. Так, служби Lycos та AltaVista повідомили про зафіксовані спроби реєстрації вузлів з неправильними адресами і спроби видалення адрес з бази індексів, можливо, з метою нанесення шкоди конкурентам. Деякі розробники намагаються ввести в оману роботів пошукових систем за допомогою «приманок» — до Web-сторінки включаються популярні ключові слова, набрані невидимим шрифтом (таким, що збігається за кольором із фоном). Це може призвести до неправильного оцінювання релевантності сторінки.

  • і запити, і їх інтерпретація реалізуються у пошукових системах по-різному. Більшість систем надають користувачеві можливість сформулювати простий запит у формі фрази природною мовою без загальних слів, союзів і прийменників або складний запит, який враховує специфіку пошукового апарата системи. Складний запит дає змогу варіювати різні параметри пошукового процесу.

Для того щоб підвищити ефективність пошуку, слід провести попередній аналіз теми інформаційного запиту і визначити:

  • унікальні слова, спеціальні терміни, назви, абревіатури або акроніми для даної теми. Пошук за такими словами найбільш ефективний. Для точного задання граматичної форми слова слід розрізняти великі і малі літери, у деяких системах з цією метою також використовується символ «!». Якщо розшукується назва, перед відповідним словом може вказуватись оператор «title:»;

  • спільноти, організації, установи або окремих осіб, сайти або Web-сторінки яких можуть містити потрібну інформацію або корисні посилання. Знайдені сторінки можуть стати стартовими для подальшого пошуку;

  • стійкі вирази (словосполучення, фрази), які стосуються даної теми, наприклад «правове регулювання» або «набуття чинності закону». Для такого пошуку слід використовувати лапки (дуж­ки) або оператори відстані. Це уточнює запит і зменшує кількість документів, що видаються;

  • інші слова, які можуть траплятись у будь-якому документі з заданої теми. Як ключові слова найчастіше використовуються іменники, рідше — прийменники і зовсім рідко — дієслова, прислівники, прийменники, сполучники.

Пошук може здійснюватись як за окремим словом, так і за їх сукупністю — слова сполучаються за допомогою логічного оператора «AND» (від англ. «та») або символу «+». За статистикою, українські користувачі вводять у запиті в середньому 2,5 слова, а закордонні — 1,5 слова. На запит з одним словом система видасть більшу кількість посилань, але при збільшенні слів результати будуть точнішими.

Бажано визначити для кожного слова із запиту можливі синоніми, еквівалентні терміни, інші варіанти написання. Синоніми можна вказати у цьому ж запиті через оператор «OR» (від англ. «або») або використати в наступному запиті, якщо перший не приніс бажаних результатів. Деякі системи дають змогу вказати сукупність еквівалентних термінів за допомогою дужок, наприклад (french francaise). Слід також ураховувати існування різних словоформ (наприклад, різних закінчень), якщо така можливість надається системою. Наприклад, вираз правов* може охоплювати слова «правовий», «правове», «правова» та ін. Деякі системи роблять це автоматично.

Формулюючи запит, слід передбачати, які нерелевантні докумен­ти можуть бути видані у відповідь на запит з такими словами або фразами. Крім омонімії в одній мові, можуть траплятись слова-омоніми, що належать різним мовам. Наприклад, спільними для української та російської мов є слова «лист», «приклад», «стан» та ін. За можливістю слід вказувати мову документів, що розшукуються.

Варто також зважати, що деякі пошукові системи ігнорують так звані «стоп-слова» — прийменники, частки, сполучники і т. ін., а деякі їх враховують.

Виключити з пошукового запиту певні слова можна за допомогою оператора «NOT» (від англ. «не») або символу «-». Наприклад, запит малі підприємства -кооперативи означає, що зі списку знайдених ресурсів будуть виключені ті, в яких трапляється слово «кооперативи».

Після завершення обробки запиту система видає список посилань на Web-сторінки та інші елементи інформаційних ресурсів Інтернет. Деякі системи пропонують виконати повторний пошук «серед знайденого», що корисно в разі великої кількості виданих елементів. Перегляд та остаточне оцінювання знайдених результатів користувач має виконувати вручну.

Якщо система не знайшла документи, що відповідають указаному запиту, рекомендується вибрати ширший термін для пошуку. Наприклад, під час пошуку деякого закону США рекомендується спочатку знайти сервери з американським законодавством. Якщо пошук проводився за словосполученням, можна поослабити умови, виключивши із запиту одне або кілька слів.

Слід також пам’ятати, що в Інтернет існують ресурси, не охоп­лені пошуковими системами та пошуковими каталогами — так званий «невидимий Web». «Невидимий Web» можна розбити на дві частини:

  • вміст спеціалізованих баз даних, які не зберігаються у вигляді певних Web-сторінок, а динамічно формуються спеціально у відповідь на конкретний запит до цієї бази;

  • сторінки, які виключають з поля зору пошукової системи згідно з прийнятою політикою. За відсутності конкретних технологічних причин до бази даних пошукової системи можуть включатись тільки ті сторінки, що відповідають певному критерію. Особливо це актуально для пошукових систем з величезними обсягами індексів.

У будь-якому разі пошук інформації в Інтернет — це задача, яка вимагає творчого підходу, а стратегії пошуку повинні змінюватись залежно від результатів, що видаються у відповідь на запит. Опановувати їх доцільно ще й тому, що сфера використання інструментарію пошукових систем розширюється — створюються версії популярних систем для окремих вузлів Інтернет та корпоративних інтрамереж.