Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
modem.pdf
Скачиваний:
10
Добавлен:
17.05.2015
Размер:
3.06 Mб
Скачать

Адреса документов

Теперь заглянем внутрь системы WWW и посмотрим, как в ней организованы гипертекстовые связи. Каждой ссылке в WWW до кументе поставлен в соответствие особого вида адрес, который го ворит системе, где искать данный информационный ресурс. В этих специальных адресах, которые называются URL (Uniform Resource Locators), стоит уметь разбираться, так как, зная URL нужного источника, вы можете дать Web клиенту команду перей ти в него сразу, не тратя время на поиск.

Свои URL адреса могут иметь самые разнообразные источни ки: WWW документы, доступные через FTP файлы, telnet соеди нения и т. п. Поэтому URL должен говорить не только о том, где находится источник, но и как к нему обратиться. URL адрес, та ким образом, состоит из двух частей, разделенных двоеточием, —

протокола доступа и собственно адреса:

<1Н1111> :<(1()рСС'>

Так, если ссылка обеспечивает возможность послать электронное письмо по некоторому адресу, то в качестве протокола доступа в URL этой ссылки указывается идентификатор «mail to», а в качестве адреса — электронный адрес получателя, например:

mailto: dkOsyiiibol. ru

Когда пользователь щелкнет мышью по такой ссылке в окне броузера, программа вызовет текстовый редактор для написания письма, а по завершении сама отошлет его по указанному в URL адресу.

Конечно, самый распространенный вид ссылок в WWW — на другие гипертекстовые документы. Для передачи по сети этих до кументов разработан специальный протокол, называемый HTTP (HyperText Transfer Protocol). В URL адресах ссылок, ведущих к WWW документам, в качестве протокола связи указывается «http».

Адресная же половина URL в этом случае сама распадается на две составные части. Чтобы однозначно указать местоположение WWW документа (который с точки зрения сервера является не чем иным, как обычным файлом), требуется знать две вещи: ин тернетовский адрес сервера и полное имя файла, включающее путь к каталогу, в котором он находится. Например, URL адрес

http://www.symbol.ru/dk/index.html

содержит в себе следующую инструкцию броузеру: связаться по протоколу HTTP с узлом www.symbol.ru, перейти на нем в ката

лог /dk и взять оттуда файл index.html. Именно эту последова тельность действий броузер и проделает, если вы щелкнете по ссылке с таким URL. Получив же этот файл, он сразу же покажет его в своем окне, чтобы вы могли читать документ и, возможно, заказывать новые документы по ссылкам в нем.

Аналогично устроен и URL адрес, указывающий на файл, доступный по анонимному FTP. В этом случае также требуется указать адрес узла и каталога на нем. Единственное отличие — то, что в качестве протокола связи указывается «ftp»:

ftp://ftp.netcom.coin/pub/gb/gboyd/ws5earch.2ip

Наконец, URL адрес telnet соединения имеет в качестве протокола доступа идентификатор «telnet», а в правой части ука зывается адрес узла:

telnet://lingnet.army.mil

Что есть в WWW

Содержимое сотен тысяч WWW серверов, разбросанных по всему миру, столь же разнообразно и необозримо, как и сама чело веческая культура. Даже если вы абсолютно уверены, что чего то, что интересно вам, в Интернете нет, можно побиться об заклад, что отсутствие это временное. Не позднее чем через полгода этот информационный колосс вырастет еще вдвое, и соответственно возрастет вероятность того, что вы сможете выяснить ин тересующий вас факт, найти нужный текст или узнать все о чело веке, которого ищете. В конце концов, источником этой информации, вполне вероятно, станете вы сами — акт публика ции в WWW невероятно прост и удобен, а отклик аудитории ни когда не заставляет себя долго ждать.

Иными словами, на вопрос, вынесенный в заголовок раздела, можно ответить очень коротко — в WWW есть все или, по край ней мере, все, что нужно вам. Тем не менее попытка классифика ции содержимого Всемирной паутины не лишена смысла.

По видимому, быстрее всего растет сейчас корпоративный сектор WWW — сервера и сайты (стр. 218), принадлежащие коммерческим фирмам. Сложился устойчивый стереотип, которому они все стараются следовать. Как правило, сайт фирмы средних размеров содержит краткую информацию о истории и области деятельности фирмы, информацию (или ссылки на личные страницы, см. ниже) о ее сотрудниках, а также разделы с более или менее полными сведениями о продукции или услугах фирмы. Такой сайт обычно довольно статичен: информация на нем обновляется не часто и не помногу. Более крупные компании могут по

зволить себе достаточно часто обновлять не только текстовую часть, но и графические элементы своего сайта, оставаясь тем не менее в рамках выбранного стиля оформления. Как правило, на первую страницу при этом выносятся последние новости, информация о только что выпущенных продуктах и т. п.

Если же компания занимается информационным бизнесом, то, как правило, анкетная информация отступает на второй план, а сайт превращается в online аналог журнала или даже газеты с калейдоскопически меняющимся содержимым. Например, сайт издательства предлагает познакомиться с отрывками выходящих книг, сайт телекомпании — с видео и аудиоотрывками из передач, а сайт журнала, как правило, не только предлагает оп line версии всех вышедших номеров, но и публикует в WWW эксклюзивные материалы, развивающие и дополняющие темы статей. Такой крупный сайт уже обзаводится своими собственными навигационными инструментами, такими как возможность поиска по ключевым словам в тексте всех документов, карта сайта и даже система «помощи» и ответы на часто задаваемые вопросы.

Некоторые из таких сайтов принадлежат некрупным компа ниям, для которых WWW является основным родом деятельно сти. Качество информационных ресурсов у них обычно даже выше, чем на сайтах крупных корпораций, — ведь у них нет ни громкого имени, ни рекламного потенциала, ни других способов привлечь внимание посетителей, кроме как качеством своих тек стов и профессиональностью оформления. Основной источник доходов таких компаний — размещение на своих сайтах рекламных ссылок.

Особый род ресурсов WWW — личные страницы (home pages), в которых авторство текста, оформления и всего осталь ного принадлежит одному человеку и которые по большей части представляют собой нечто среднее между визитной карточкой с фотографией, заполненной анкетой и семейным альбомом. Личная страница, как и сайт фирмы, будет представлять интерес для людей, не знакомых с ее автором, только в том случае, если автор вложит в нее не только желание заявить о своем существовании, но и свою способность к творчеству, в какой бы области она ни проявлялась. К счастью, WWW сам по себе служит лучшим вдохновителем для любого рода творчества.

Вероятно, самым важным видом ресурсов WWW с точки зрения пользователя являются поисковые системы, так как практически любой целевой выход в Интернет в поисках той или иной информации начинается с визита на одну из таких систем. Поисковые сервера WWW делятся на два больших класса — ав томатические индексы и тематические каталоги. Первые пред

ставляют собой огромные базы данных, хранящие тексты всех документов WWW, до которых удалось добраться, отслеживая взаимные ссылки, специальной программе — WWW роботу. С од ним из таких автоматических индексов — сервером Alta Vista — мы познакомились в гл. 7 (стр. 266).

При всех невероятных возможностях, которые открывают такие полнотекстовые индексы, у них есть два крупных недостатка:

во первых, ни один из них не в состоянии заиндексировать весь WWW до самых далеких его уголков (собственно, именно поэтому таких систем, конкурирующих друг с другом, существует не сколько), и во вторых, ни один автоматический индекс не в со стоянии обновлять свою базу данных с такой же скоростью, с какой обновляется содержимое WWW. Посетив и заиндексировав сайт, программа робот сможет снова навестить его не раньше чем через пару недель, из за чего большая часть ежедневно обновляе мого материала никогда не попадает в индекс. (Поэтому, если есть такая возможность, следует пользоваться местными поисковыми системами сайта, так как они всегда работают с самыми свежими версиями документов.)

Если автоматический индекс — это база данных текстов до кументов (хранящая, разумеется, информацию и о их местополо жении в сети), то тематический каталог представляет собой сборник ссылок на сайты, документы и другие ресурсы Интернета, снабженных описаниями и расклассифицированных по тематическим разделам и подразделам. Ссылки эти собираются и обрабатываются людьми, что имеет два важных следствия: во первых, в любом тематическом каталоге ссылок гораздо меньше, чем в автоматическом индексе, а во вторых, качество информационных ресурсов, удостоенных занесения в такой каталог, в среднем значительно выше.

Процесс поиска информации с помощью каталогов обычно более прост и предсказуем; каталогами имеет смысл пользоваться тогда, когда вы знаете, что в сети есть много информации на интересующую вас тему, и хотите начать обзорное знакомство с лучших из имеющихся ресурсов. Наоборот, автоматические ин дексы полезны в тех случаях, когда вы ищете информацию чисто фактическую или же просто редкую.

Броузeр

Главная, а нередко и единственная программа, с которой работает пользователь прямого подключения (не считая драйвера TCP/ IP), — это клиент системы WWW, называемый броузером. Как мы видели в разделе о URL адресах, WWW документ с одинако

вой легкостью ссылается не только на другие WWW документы, но и на практически любые виды ресурсов, доступных в Интерне те. А это значит, что броузер обязан обрабатывать эти ссылки и, следовательно, уметь выполнять функции клиента FTP, Gopher и других систем.

Современные броузеры, такие как Netscape Navigator, идут еще дальше в этом направлении. Хотя в том, что касается электронной почты, единственное требование к броузеру — уме ние обрабатывать ссылки с «mailto» (стр. 284), т. е. подготавли вать и отсылать письма, Netscape Navigator объединяет в одном пакете броузер WWW, полнофункциональную почтовую про грамму и online клиента для работы с серверами телеконфе ренций.

Но, разумеется, все же главная функция броузера WWW — это просмотр WWW документов, размеченных с помощью языка HTML (см. врезку на стр. 283). В этой области фирма Netscape сыграла несколько двусмысленную, хотя и безусловно выдаю щуюся роль. Дело в том, что язык HTML изначально был предна значен лишь для логической разметки документа и не располагал средствами, позволяющими влиять на визуальное представление документа в броузере. Для этого были свои причины — при соз дании WWW одним из приоритетов была переносимость его содержимого, которая позволила бы работать с ним не только в графических операционных системах, но и в системах с тексто вым (и даже «звуковым» — с синтезатором речи) интерфейсом.

Поэтому с самого начала инструкции форматирования как таковые в HTML отсутствовали — невозможно было, скажем, за дать точный кегль шрифта или отступ после заголовка. Броузеры для разных компьютеров и операционных систем использовали доступные в каждом конкретном случае средства оформления, и внешний вид WWW документов при этом мог довольно сильно меняться. Ни о каком дизайне страниц в обычном смысле этого слова речи быть не могло.

Фирма Netscape решительно порвала с этой традицией и на воднила HTML многочисленными расширениями, обогащающи ми возможности визуального оформления документов. Поначалу эти расширения поддерживались только броузером Netscape Nav igator, но теперь многие из них добавлены в официальный стандарт языка и поддерживаются броузерами других фирм. Во многом именно благодаря этому WWW приобрел такую не имоверную популярность — ведь «внешние данные» для массовой аудитории всегда значили больше, чем сохранение переносимости и верность логике собственного развития.

Однако расширение возможностей HTML — не единственное направление развития броузеров. Современные WWW документы

все дальше отходят от своего начального прообраза — листа бумаги с текстом и изображениями. Многим уже не хватает того минимального уровня интерактивности, который предлагает сам HTML (а именно — возможности вставить в HTML документ бланк, который пользователь заполнит и нажатием кнопки отправит на сервер). Поэтому современные броузеры включают поддержку новых технологий интерактивности, в первую очередь языка Java.

Броузер, поддерживающий Java, способен не только показывать тексты и изображения, но и запускать (интерпретировать) программы на языке Java, встроенные в WWW страницы (такие программы называются апплетами). Главная отличительная черта Java — это все та же переносимость, благодаря которой один и тот же апплет может работать на любом компьютере, лишь бы там был броузер с поддержкой Java. Апплеты на этом языке могут использоваться для чего угодно: от создания простейших мультипликационных эффектов типа «бегущей строки» до реализации сложнейших интерактивных сценариев взаимодействия с пользователем (например, online игр).

Исторически сложилось так, что именно производители броузеров сильнее всего влияли на пути развития WWW. Сохранится ли такое положение в будущем — покажет время.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]