Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Методичні вказівки КМИ.doc
Скачиваний:
16
Добавлен:
24.02.2016
Размер:
6.17 Mб
Скачать

Міністерство внутрішніх справ україни

Харківський національний університет внутрішніх справ

Навчально-науковий інститут права та масових комунікацій

Кафедра інформаційних комунікацій, захисту інформації

та документознавства

МЕТОДИЧНІ РЕКОМЕНДАЦІЇ ДЛЯ ПРОВЕДЕННЯ ПРАКТИЧНИХ ЗАНЯТЬ

з дисципліни „Комп’ютерні мережі (Інтернет)”

Галузь знань 0304 - „Право”

Напрям підготовки 6.030402 - „Правознавство”

Освітньо-кваліфікаційний рівень - бакалавр

Форма навчання - денна

м. Харків

2012 р.

Практичне заняття № 1

Тема заняття: пошукові системи в Інтернеті.

Мета: навчитися налаштовувати та використовувати програми пошуку текстової і мультимедійної інформації.

  1. Підготовка до заняття:

    1. Вивчити теоретичний матеріал (теоретична частина цих рекомендацій, Інтернет).

    2. Підготувати звіт по роботі.

  1. Теоретична частина

2.1. Принцип роботи пошукових систем

На серверах пошукових служб є спеціальні програми (їх називають роботами або павуками), які збирають інформацію в Інтернеті і повертають на свій сервер всі виявлені сторінки. З накопиченої таким чином інформації формуються бази, особливим чином проіндексовані. Основні завдання пошукових серверів:  знаходити нові сайти і вносити їх у власну базу даних (сховище) адрес;  ранжувати сайти в базі даних і робити результати пошуку найбільш відповідними запитами користувачів. Пошукові системи прагнуть надавати користувачам найбільш релевантні результати пошуку. Примітка. Релевантність (від англ. Relevancy) - ступінь відповід ¬ ності документа запиту. Релевантність документа запиту користувача визначається відповідно до закладеного в пошукову систему алгоритмом. Алгоритми у пошукових систем різні, однак побудовані вони на загальних принципах, тому шукають пошукові системи приблизно однаково. Основні відмінності пошукових серверів полягають не в алгоритмах визначення релевантності, а в способах їх реалізації та сховищах адрес. При введенні запитів (ключових слів) у пошукові сервери користувач сподівається швидко отримати посилання на потрібні ресурси. А пошукові сервери, в свою чергу, конкурують між собою за видачу найбільш точних результатів. Примітка. Якщо один з пошукових серверів не зміг нічого знайти по заданому запиту, то вам слід спробувати звернутися до іншого пошукового сервера. Коли Пошукова система аналізує сайт, вона «бачить» тільки текст і не сприймає дизайн сайту, кількість картинок або анімацію. Таким чином, пошукова система оцінює тільки текст - скільки разів зустрічаються ключові слова, як близько до початку сторінки вони знаходяться, в яких розділах веб-сторінки зустрічаються. Пошукові сервери зазвичай мають спеціальну мову запитів, за допомогою якого можна точніше пояснити, що саме треба шукати. Однак, як правило, досить просто написати в рядку запиту кілька ключових слів, що визначають цікавить область. Сервер сам розбереться, які слова і словосполучення є ключовими. Примітка. Практика показує, що в даний момент користувачі занадто покладаються на недосконалі можливості пошукових серверів і в результаті на запит з одного-двох слів отримують абсолютно не потрібну для себе інформацію.

Ідеальний процес пошуку виглядає наступним чином:

1. Робимо загальний запит, вводячи в поле пошуку ключові слова, і натискаємо кнопку Пошук.

2. Отримавши відповідь з результатами, виділяємо в ньому описи найбільш підходящих посилань.

3. Додаємо до колишнього запитом уточнюючі ключові слова, які є в описі потрібних посилань, і повторюємо процес.

Крім описаного варіанта пошуку на багатьох сайтах можна скористатися пошуком через тематичні каталоги, в яких посилання на сайти розділені по темам. Якщо ви все робите правильно, то кожний запит наближає вас до потрібної інформації. Таким чином, з кожним кроком зменшується невідповідність між потрібною інформацією і тим, що видає пошуковий сервер. Наприклад, вам необхідно знайти розклад поїздів, що проходять через Тулу. Як загальне запиту в рядку пошуку можна спробувати вказати пошукового сервера: «розклад всіх потягів, що проходять через Тулу». Однак за таким запитом, наприклад, Яндекс знаходить лише розклади поїздів, що проходять через Самару, Санкт-Петербург, Калугу, але Тули серед результатів пошуку не видно. Це ні в якому разі не означає, що цієї інформації в базі пошукового сервера немає, просто запит був складений не дуже вдало. Справа в тому, що будь-яка пошукова система прагне знайти веб-сторінки, на яких знаходиться максимальна кількість слів із запиту, більше того, якщо ці слова ще слідують один за одним, то такі сторінки будуть виведені першими. Приміром, якщо в тексті веб-сторінки зустрічається фраза «розклад всіх потягів, що проходять через Самару» (що містить п'ять загальних із запитом слів), то при відсутності навіть слова «Тула» система з великою ймовірністю включить цю веб-сторінку в список результатів, хоча вона і не відповідає запиту. Тому потрібно скорегувати запит, прибравши всі зайві слова і залишивши тільки ті, які точно характеризують вашу потребу. В даному випадку зайвими словами є «всіх», «проходять», «через», які можуть зустрічатися на яких завгодно сторінках. Задавши виправлений запит «розклад поїздів Тула», ви точно отримаєте те, що шукали. Більшість користувачів саме так і роблять, проте для того, щоб швидко і ефективно знаходити потрібну інформацію, просто скоректувати запит буває недостатньо. Необхідно ще застосовувати оператори мови запитів пошукового сервера. Ці оператори допомагають знаходити таку інформацію, яку буває складно знайти за допомогою простих запитів. Далі розглянуті оператори, загальні для більшості пошукових серверів. Один з таких операторів - оператор строгої відповідності; як правило, в сучасних пошукових системах це лапки "". Поєднання слів, яке ви вкажете в лапках, враховуватиметься сервером як єдине ціле, тобто ви задаєте порядок слідування слів одне за одним. Наприклад, за запитом комп'ютерні журнали (без лапок) можна отримати в результатах пошуку веб-сторінки зі словами, що згадуються відособлено, тобто на одній сторінці може бути слово «комп'ютерні», на іншій - «журнали» і т.д. Конструкція ж "комп'ютерні журнали" (в лапках) змушує пошукову систему відкинути всі зайві сторінки і показувати лише ті, на яких ці два слова йдуть один за одним. Ще два оператори - обов'язкової наявності слова «+» і обов'язкового відсутності слова «-». Наприклад, якщо ви хочете знайти сайт журналу «Компьютерра», досить до запиту комп'ютерні журнали додати + Компьютерра, тобто отримаємо "комп'ютерні журнали" + Компьютерра. Якщо ж потрібно знайти всі журнали, окрім «Компьютерра», слід ввести "комп'ютерні журнали"-Компьютерра.

Досить часто буває необхідно, щоб шукані ключові слова містилися в межах одного документа. Для цього слід використовувати логічний оператор І (AND). Однак у всіх пошукових системах цього ж результату можна досягти, поставивши між словами звичайний пропуск. Наприклад, запити комп'ютерні журнали і комп'ютерні AND журнали, як правило, дадуть один і той же результат. Логічний оператор АБО (OR) дозволяє знайти сторінки, що містять хоча б одне слово із запиту. Наприклад, за допомогою запиту комп'ютерні OR журнали можна знайти документи, в яких зустрічається або слово «комп'ютерні», або слово «журнали». Примітка. З мовами запитів конкретного пошукового сервера можна ознайомитися в його розділі допомоги. Багато хто з серверів володіють власними додатковими операторами, які можуть стати в нагоді досвідченим користувачам. Тепер наведемо описи найбільш популярних пошукових служб.