- •Министерство образования российской федерации
- •Мировые информационные ресурсы
- •Введение
- •Тема 1: Web-технология и Всемирная паутина
- •Как создаются Web-страницы?
- •Поисковые машины, серверы и системы
- •Наиболее популярные ресурсы по поиску информации
- •Тема 2: Создание гипертекстовых документов посредством языка html Форматирование текста
- •Основные тэги html
- •Названия и коды цветов
- •Расчетное задание №1 Работа с текстовыми тэгами
- •Графические изображения
- •Вставка графики
- •Гиперссылки
- •Гипертекстовые ссылки
- •Расчетное задание №2 Внедрение графики в html-документ и использование гиперссылок
- •Элементы html для построения таблиц
- •Расчетное задание №3 Использование таблиц и фреймов
- •Формы (формуляры)
- •Использование скриптов
- •Расчетное задание №4 Работа с формами и использование JavaScript
- •Мировые информационные ресурсы
Поисковые машины, серверы и системы
Поисковые машины предназначены для сбора данных, которые затем передаются поисковым системам. Такие машины работают в автоматическом режиме, т. е. специализированное программное обеспечение осуществляет путешествие по ресурсам сети и заносит собранные данные в базу. Иногда, это роботизированная поисковая система, черпающая адреса своего маршрута поиска из данных, внесённых пользователем при регистрациях сайтов. Но чаще это самостоятельно работающие машины, не имеющие постоянного сетевого адреса.
Сбор информации о содержимом сайтов или отдельных страниц имеет название индексация. Её суть состоит в том, что при попадании на страницу с данными, специальная программа анализирует её содержание, заголовки, мета тэги, подписи к изображениям и др. и заносит в свою базу информацию о тематике и предмете статьи.
Это осуществляется специальными программами, которые называются spiders (пауки), crawlers (ползуны, пресмыкающиеся), robots (роботы), walkers (пешеходы) и т. п. Для того чтобы обойти всю сеть, мощному роботу нужно от нескольких дней до нескольких недель. При этом составляется весьма свежий и довольно подробный индекс – опись содержимого доступных ресурсов. При каждом новом цикле индекс обновляется, и старые недействительные адреса удаляются.
Поисковые системы служат непосредственно для поиска ссылок на интересующие пользователя источники сети. Они бывают двух типов: роботизированные (Search Engines) и каталоги (Directories). Пользователю же предоставляется возможность поиска без предварительных знаний об особенностях функционирования таких систем.
Несмотря на это, методология эффективного поиска существует. Её секрет заключается в правильном запросе, который пользователь отправляет поисковой системе. Если Вас интересует хорошо разработанная и часто востребуемая тема - популярный материал (например, адреса провайдеров Internet или публикации научных документов) - то можно воспользоваться каталогом, расположенным на первой странице каждой поисковой системы. Метод работы - обычный: двигаясь от общего к частному, Вы достигаете списка нужных Вам сайтов.
Для более специального поиска (например, информации о нанотехнологии или о редких породах кошек), как правило, необходимо использовать ключевые слова: все развитые поисковые системы предлагают мощные инструменты поиска по ключевым словам. Диалог простого поиска у большинства машин весьма схож: вводится ключевое слово - и получаете результат в виде сгенерированной страницы отчёта о результатах поиска. Два или более слов соберут все документы, в которых встречаются эти слова - все вместе или по одному. Если Вас интересует только словосочетание - возьмите его в кавычки. Знак “плюс” перед словом означает, что оно должно обязательно присутствовать в результатах поиска, знак “минус” - что его не должно быть.
Сложный поиск позволяет получить значительно более точный результат. При сложном поиске используются стандартные булевы команды or, and, not, реже near, close, before. Интерфейсы сложного поиска у разных поисковых систем существенно отличаются; для наиболее эффективного использования рекомендуем внимательно почитать раздел Advanced Search Help той поисковой системы, которой Вы пользуетесь.
Мета поиск (использование одного Web-узла для обращения к нескольким поисковым машинам одновременно) — этот сервис встречается реже, но даёт возможность производить более обширный поиск в более сжатые сроки.
Таблица 1