Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Методичка 2003год по МИР_часть2 .doc
Скачиваний:
4
Добавлен:
21.04.2019
Размер:
499.71 Кб
Скачать

Министерство образования российской федерации

ХАКАССКИЙ ТЕХНИЧЕСКИЙ ИНСТИТУТ – ФИЛИАЛ

КРАСНОЯРСКОГО ГОСУДАРСТВЕННОГО

ТЕХНИЧЕСКОГО УНИВЕРСИТЕТА

Мировые информационные ресурсы

Методические указания

Абакан 2004

УДК 681.3,06

С60

Мировые информационные ресурсы: Методические указания к выполнению расчетных работ для студентов специальности 351400.Часть 2 / Сост. Т. В. Соловьева. Красноярск, КГТУ, 2004. 36c.

Печатается по решению

редакционно-издательского совета университета

 КГТУ, 2004

Введение

При изучении дисциплины «Мировые информационные ресурсы» рассматриваются принципы функционирования компьютерных сетей. Происходит знакомство с протоколами, используемыми в сетях. Особое внимание уделяется поиску и обработке информационных ресурсов в глобальной информационной сети.

Однако изучение данной дисциплины не ограничивается этими вопросами. Так, наряду с организацией поиска новой информации, имеющей отношение к заданной тематике, изучается язык гипертекстовой разметки(HyperText Markup Language). Таким образом, решается такая важная задача курса, как освоение Web-технологии, на основе которой построена одна из популярнейших услуг Internet - Всемирная паутина(World Wide Web). Именно практическому созданию собственных информационных ресурсов, которые можно использовать в сети, посвящена вторая часть методических указаний.

Тема 1: Web-технология и Всемирная паутина

Первоначально гипертекст – так стала называться технология работы с большим массивом текста, хранящегося на диске компьютера в электронном виде, был применен при разработке справочных систем.

С помощью этой технологии можно было очень быстро просмотреть все связанные между собой статьи. Слабым местом таких справочников было то, что человек мог пользоваться преимуществами гипертекста со ссылками только в рамках одной какой-то конкретной системы. Не было возможности организовать ссылки на другой справочник в пределах даже одного компьютера и, тем более, на какие-то другие хранилища информации. Но проблема была решена. В ноябре 1990 года Tim Berners-Lee - сотрудник Европейского центра ядерных исследований(CERN), разработал новые принципы работы с документами в сети. Идея была проста: следовало всю информацию, хранящуюся на сетевых серверах, представлять в стандартном виде, не зависящем от типа платформы или операционной системы. При «стандартной » технологии та или иная программа, получая доступ к нужному ей файлу, должна указать операционной системе: диск, на котором записан файл, каталог и собственно имя файла. При загрузке файлов по новой технологии документ должен быть описан набором атрибутов, в который входит, в том числе и номер компьютера в сети. Благодаря этому можно было бы получить любой документ, расположенный на любом компьютере, включенном в сеть.

Технология была названа автором World Wide Web.

До появления Web-технологии пользователь мог только просматривать списки файлов, хранящихся на удаленных серверах, затем «перекачивать» их на свой компьютер и уж только тогда использовать их: просматривать текст или запускать программы.

Адресация в сети Интернет

Сегодня по технологии WWW работают такое огромное количество компьютеров, что сам термин постепенно стал неким синонимом слова «Интернет» (что, вообще говоря, неверно). Как же работает система по технологии WWW?

Любой компьютер, подключенный к сети, имеет свой уникальный номер в этой сети (IP- адрес), который используется клиентской программой (браузером) для осуществления запроса серверу.

Итак, в сети Интернет используется не просто адрес, а IP-адрес (IP расшифровывается как Internet Protocol) - последовательность четырех чисел, от 0 до 255 каждое, разделенных точками, например: 192.168.5.1.

Каждый компьютер в сети Интернет обязательно имеет такой адрес, причем адреса различны. Компьютеры, к которым подключаются пользователи, часто называют хост-компьютерами, и они имеют один (или несколько) постоянных адресов в Интернет, а компьютеры пользователей обычно при каждом сеансе связи получают новые адреса, хотя могут иметь и постоянные.

Доменная система имен

Для пользователей числовой IP-адрес все же неудобен, поэтому была придумана доменная система обозначения компьютеров. Компьютеры теперь можно обозначать не трудными для запоминания цифрами, а словами (именами), при этом сеть оказалась поделенной на части, называемые доменами (лат. dominium - владение). Домены даются во "владение" различным организациям, которые отвечают за их поддержку. Домены могут быть вложены друг в друга, т.е. организация, отвечающая за более крупный домен, имеет право назначать более мелкие в пределах этого домена.

Вот типичный пример доменного имени, по которому осуществляется доступ к Web-серверу:

http://www.microsoft.com.

Домены отделяются друг от друга точками. Доменная система образования адресов гарантирует, что во всем Интернете больше не найдется другого компьютера с таким же адресом.

В имени может быть любое число доменов, но чаще всего используются имена с количеством доменов от трех до пяти.

Для доменов нижних уровней можно использовать любые адреса, но для доменов самого верхнего уровня существует соглашение. В системе адресов Интернета приняты домены, представленные географическими регионами. Они имеют имя, состоящее из двух букв. Например, географические домены некоторых стран обозначаются: fr - Франция;

ca – Канада;

us – США;

ru – Россия.

Домены, разделенные по тематическим признакам, имеют трехбуквенное сокращенное название. Например:

edu – учебные заведения;

gov – правительственные учреждения;

com – коммерческие организации.

В первой части методических указаний мы разобрали, что обмен информацией внутри сети осуществляется на основе протоколов – наборов правил, позволяющих клиенту и серверу правильно опознавать: что именно они передают друг другу. В Интернете используется двухуровневый протокол TCP/IP. Этот протокол позволяет передавать информацию только в виде байтовых пакетов (последовательности байт данных). Но переданные таким образом данные могут быть чем угодно (даже компьютерным вирусом). Следовательно, необходим еще один протокол, который позволяет из байтовых пакетов «собрать» гипертекст. Такой протокол называется протоколом передачи гипертекста. Аббревиатура английского названия этого протокола (Hypertext Transfer Protocol) и есть HTTP.

Таким образом, http:// в доменном имени указывает, что полученные данные браузер должен интерпретировать, как HTML- документ.

Унифицированный указатель ресурсов (URL)

После вышеприведенных рассуждений перейдем к такой важной для Web-разработчика концепции, как унифицированный указатель ресурсов — URL (Uniform Resource Locator).

URL — это способ адресации к любому устройству или ресурсу в Интернет. Все URL имеют следующий стандартный формат:

<схема доступа>:<информация, зависящая от схемы доступа>

Схема доступа содержит информацию:

  • об используемом приложении;

  • о типе ресурса, который необходимо использовать (например,Web-страница);

  • о механизме доступа к ресурсу (то есть о протоколе передачи данных, например http или ftp).

Вторая часть URL, то есть информация, зависящая от схемы доступа, определяет:

  • удаленный компьютер Сети, на котором хранится запрашиваемая информация;

  • полный путь к файлу на этом удаленном компьютере.

URL однозначно определяет, во-первых, какой протокол ис­пользуется для соединения, во-вторых, на каком конкретно ком­пьютере (из миллионов, подключенных в Сеть) расположена зап­рошенная информация и, в-третьих, в каком конкретно файле на этом компьютере находится эта информация (и где на диске ком­пьютера помещен этот файл).

В более привычном виде (мы его уже разбирали выше), URL выглядит следующим образом:

протокол://имя_машины.имя_домена/полное_имя_файла

Название протокола (схемы доступа) отделяется двумя косыми чертами от интернет-адреса компьютера, который, в свою очередь, отделен одной косой чертой от полного (с указанием пути) имени файла.

Как пример, можем разобрать следующий адрес Web-pecypca:

http://www.tutorial.ru/name/index.htm

Давайте рассмотрим составляющие этого URL:

  • http: — для доступа к ресурсу используется протокол передачи гипертекста (HyperText Transfer Protocof), то есть содержимое ресурса может быть просмотрено Web-браузером.

  • www.tutorial.ru - идентифицирует интернет-адрес компьютера Сети, на котором размещен указанный ресурс. Это так называемое доменное имя компьютера.

  • /name/index.htm – полное имя файла, расположенного на данном компьютере.