Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Основы работы с поисковой системой Яндекс с кар...doc
Скачиваний:
4
Добавлен:
09.11.2019
Размер:
1.92 Mб
Скачать

Поиск по заголовку

HTML (Hyper Text Markup Language, язык разметки гипертекста) - это язык, с помощью которых формируются все страницы в Интернете.

С его синтаксисом полезно ознакомиться всем, кто работает в сети.

Первое, что приходит в голову, чтобы начать это делать - поискать учебник.

В строке поиска пишем "учебник по HTML" и смотрим результаты (рис. 1.29):

Рис. 1.29. Результаты поиска по запросу "учебник по HTML"

16 миллионов страниц, содержащих поисковый запрос - это много.

Среди них наверняка будут попадаться рассуждения о языке HTML, впечатления от учебников HTML, впечатления от впечатлений от учебника HTML.

Словом, довольно много лишней информации. Для быстрого поиска именно учебника по HTML логично предположить, что это словосочетание должно быть в заголовке страницы.

Переходим на страницу расширенного поиска и формируем следующий запрос (рис. 1.30):

Здесь мы снова указали, что искомые слова "Учебник по HTML" идут подряд.

В разделе "расположены" на странице установили переключатель "в заголовке".

Наконец, как и ранее, выбрали переключатель "точно так, как в запросе".

В результате выполнения этого запроса область поиска существенно сузилась, теперь мы видим именно учебники (рис. 1.31):

Рис. 1.30. Условия поиска по заголовку

Обратим внимание на строку поиска - она содержит такую формулировку: title[!(Учебник по HTML)]. Структура title[искомое слово] и представляет собой запись поиска по заголовку страницы.

В данном случае внутри нее находится структура !(Учебник по HTML), означающая, что слова употребляются в тексте, точно так, как в запросе.

Сохраненная копия. Еще с сайта

Всякий раз, когда мы разглядываем результаты любого запроса, на странице выводятся ссылки "Сохраненная копия" и "Еще с сайта".

Разберем сначала первую из них.

Индексация, всех сайтов, информацию на которых ищет Яндекс, сопровождается созданием копии этих сайтов, которые размещаются на серверах Яндекса.

Грубо говоря, Яндекс хранит на своих серверах весь Рунет и значительную часть Интернета.

Конечно, на серверах, в кэше, размещаются не все страницы сайтов, а также не все элементы сайтов - чаще всего хранится лишь текстовое содержимое.

Также не нужно представлять себе Яндекс в качестве некоего суперархива, в который попадают все странички, которые когда-либо были в сети.1)

Кэш Яндекса динамический, его содержимое постоянно обновляется по мере изменения основных сайтов.

Как это использовать? Для чего нужна ссылка "Сохраненная копия".

Представим себе, что некоторая газета опубликовала скандальную статью.

Поисковый бот Яндекса невозмутимо прошелся по сайту этой газеты и проиндексировал ее, сохранив копию на свой сервер.

Тем временем широкая общественность, возмущенная статьей, потребовала удалить ее с сайта, а журналиста, который написал статью - уволить.

Главный редактор газеты, посыпая голову пеплом, выполняет эти требования.

Статьи на сайте газеты больше нет. Драматические события развиваются чрезвычайно быстро, буквально в течении утра.

Тем временем, некоторый читатель, который проснулся к обеду, заходит в сеть и видит, что форумы и блоги кипят от обсуждений этой статьи.

Он набирает в Яндексе ее название, переходит по ссылке на сайт редакции и получает ошибку 404.

Статьи, конечно, больше нет, но есть ссылка "Сохраненная копия", перейдя по которой читатель получает удовольствие от шокирующих подробностей копии статьи.

Когда эта ужасная статья исчезнет из кэша Яндекса? Когда поисковый бот, скажем, после обеда еще раз пройдется по сайту газеты и проиндексирует его.

Статьи там больше нет, значит содержимое кэша тоже обновится и наступит полная гармония в сети.

Пользователям, остается ловить промежутки времени между переиндексацией Яндекса после удаления некоторых материалов.

Можно сказать, что если где-то исчезли материалы, то в течении нескольких часов их еще можно будет вытащить из кэша Яндекса по ссылке "Сохраненная копия".

Конечно, не все столь драматично и интересно.

Чаще всего ссылка "Сохраненная копия" помогает, когда материалы основного сайта недоступны по причине банального падения сервера.

"Сохраненная копия" - это возможность увидеть материалы, которые были перемещены, удалены или недоступны.

Работает в течение определенного промежутка времени.

Ссылкой "Еще с сайта" пользовать еще проще. При переходе по ней выводятся результаты текущего запроса, отобранные с сайта, который отображается на странице.