Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
modem.pdf
Скачиваний:
27
Добавлен:
17.05.2015
Размер:
3.06 Mб
Скачать

могут задерживаться, а изредка не приходить вообще. И все же эти серверы дают всем, чьи возможности в Интернете ограничены лишь электронной почтой, шанс приобщиться к поистине бездонным источникам информации.

Выход на другие средства связи

Весьма удобной как для деловых людей, так и для простых смертных является возможность работы через электронную почту с другими средствами связи: факсом, телеграфом, телетайпом и «бумажной» почтой. Для этого служат особые серверы посредни ки, чаще всего называемые «шлюзами» или «гейтами» (англ. gate). Сеть Редком имеет набор своих собственных шлюзов в другие средства связи — их список вы сможете получить у своего провайдера (см. также стр. 216). Существуют и зарубежные серверы такого рода (см. приложение 4).

Чтобы послать, например, факс, пользователь шлет на факс шлюз письмо, содержащее сам текст, номер факса и, возможно, особые команды оформления. Шлюз, обработав это письмо и получив файл факса в графическом формате, посылает его на один из подчиненных ему узлов, занимающихся рассылкой фак сов, — чаще всего на тот, который ближе всего к пункту на значения.

Команды оформления, которые понимает сервер, могут быть весьма разнообразными: установка кегля шрифта, формата страницы, включение в письмо графических файлов (они под шиваются к письму в закодированном виде) и т. п. Для телетайп ных и телеграфных шлюзов нужно учитывать довольно сложные правила (в основном касающиеся использования различных букв и специальных символов), которые должны выполняться, чтобы сообщение можно было передать по этим каналам связи. Как все гда, подробные инструкции вы получите, послав на любой из этих серверов письмо с командой «help».

Эти же шлюзы предоставляют и услуги по получению на ваше имя сообщений через соответствующий вид связи и пересылке их вам через электронную почту. Заведя свой почтовый ящик на таком шлюзе, вы сообщаете всем, что вам можно посылать, скажем, факсы по такому то телефонному номеру (номеру шлюза) с указанием такого то идентификатора (выбираемого вами). Получив факс, сервер по этому идентификатору определяет, кому послать его по почте (в виде закодированного графического файла).

Чтобы работать с каким либо из шлюзов Релкома, вы должны сначала зарегистрироваться на нем, что обычно

уплату некоторой суммы вашему провайдеру. Расценки, которые можно получить со шлюза по специальной команде, включают в себя цены на передачу, прием корреспонденции, а также на сервисные услуги (поиск факса с неверным идентификатором, по сылка бумажного письма заказным и пр.).

Информационно:поисковые

системы

В Интернете существует множество информационно поисковых систем и баз данных, предоставляющих различную информацию , и, в том числе, призванных помочь пользователю ориентировать ся в ресурсах сети. В этом разделе мы рассмотрим те из них, ко торые доступны обладателю почтового подключения.

Поиск по ключевым словам

Одним из основных инструментов работы с разнообразными базами данных, в том числе информационно поисковыми системами Интернета, является поиск по ключевым словам. Если вы хоть раз пользовались автоматическим поиском в текстовом редакторе, то вы вполне представляете себе, что это такое. Однако стоит обратить внимание на несколько важных обстоятельств.

Выясните, имеет ли значение для поиска регистр букв. В боль шинстве систем по умолчанию поиск нечувствителен к регистру (case insensitive), но иногда бывает наоборот. Если же ключевые слова состоят из кириллицы, то лучше вообще не рассчитывать на способность системы менять регистр букв. Поэтому, если вы ищете, скажем, слово «кенгуру», то программе лучше задать «енгуру», так как в тексте это слово может стоять в начале предложения и начинаться с заглавной буквы (правда, это все равно не поможет в случае «КЕНГУРУ»).

Заказывая поиск русских слов, помните также об их изменяемости и отсекайте окончания. Например, если вы ищете слово «математика», ключевым словом должно быть «математик». Синтаксис некоторых поисковых систем позволяет писать что то вроде «математик*», чтобы найти все слова, начинающееся с «математик».

В некоторых системах поиска есть специальный режим поиска «целых слов» (whole word). Это означает, что если вы заказываете программе найти слово «action», можно не опасаться, что она сработает на «satisfaction». Убедитесь, что этот режим не установлен по умолчанию, — в таком случае, очевидно, урезанные ключевые слова, о которых мы говорили выше, работать не будут.

Большинство систем позволяют задать сразу несколько слов для поиска. В этом случае важен вопрос о том, с помощью какого логического отношения строится результат. Если используется логическое «И» (logical «and»), то в результаты поиска включаются только те документы, в которых найдены все из указанных ключевых слов, а огическое «ИЛИ» (logical «or») подразумевает, что любой документ, в котором есть хотя бы одно ключевое слово, будет выдан в качестве результата. В большинстве систем по умолчанию используется отношение «ИЛИ», а некоторые даже позволят вам конструировать свои собственные логические выражения любой сложности.

Некоторые из самых развитых систем (например, Alta Vista, см. стр. 266) реализуют более сложный тип поиска. Когда вы задаете несколько ключевых слов, программа учитывает различные факторы: какое количество ключевых слов из списка найдено в документе, сколько раз встретилось каждое из них и даже то, насколько близко друг к другу (или к началу документа) располагаются в тексте ключевые слова. На основании всего этого вычисляется общая оценка документа, и в качестве результата выдаются те документы, оценка которых выше некоторого порога. Такой способ поиска — самый эффективный, так как он наиболее точно моделирует процесс поиска информации человеком.

При работе с системами поиска — даже такими развитыми, как Alta Vista, — очень важно по возможности компенсировать жесткую логику программы как можно большим разнообразием и «расплывчатостью» набора ключевых слов. Вспомните. как можно больше синонимов для того понятия, которое вы ищете, укажите его родовые и видовые термины, слова, связанные с ним ассоциативно, и т. п. Хотя это сильно увеличит объем результатов, опыт показывает, что только так можно обеспечить с достаточной надежностью отлов нужного материала.

Система серверов Archie предназначена для поиска файлов, доступных на узлах сети по анонимному FTP (стр. 278). Сервер Archie представляет собой программу, которая самостоятельно путешествует по сети в режиме online, заходит на FTP серверы и смотрит, какие файлы на них можно взять, собирая таким образом базу данных. Каждый Archie сервер периодически обновляет свою базу как с помощью самостоятельных исследований, так и обмениваясь информацией с другими Archie серверами.

Любой желающий может поработать с Archie как в режиме online, так и через почту. Основная возможность — поиск в базе данных по ключевым словам. Как обычно, любой Archie сервер

пришлет полное описание своих команд в ответ на письмо с ко мандой «help». Приведем основные команды Archie серверов:

find <ключевое слово — поиск в базе данных по ключевому слову. Результатом будет список FTP узлов и каталогов на них, в которых имеется файл, имя которого содержит ключевое слово (пример см. ниже).

list <ключевое слово> — поиск по ключевому слову в другой базе данных, содержащей только адреса FTP узлов.

set maxhits <число> — количество совпадений (положи тельных результатов поиска), по достижении которого программа завершает поиск.

Приведем пример. Допустим, нас интересует текстовый редактор QEdit. Пошлем на какой нибудь из Archie серверов та кое письмо:

set maxhits 2 find QEdit whatis QEdit quit

Результаты поиска в ответном письме будут выглядеть примерно так:

'•> path Dmitry Kirsanov <dk@pol.ylog.spb.su> \s

set maxhits 2

> • find QEdit я Searcn type: GUO.

Host ftp.technion.ac.il (132.68.7.8) Last updated 04:39 4 Feb 1995

Location: /pub/unsupported/simtel/msdos

DIRECTORY drwxrwxr x 1024 bytes 08:16 5 Jan 1995 qedit

Location: /pub/unsupported/simtel/msdos/qedit

FILE rw r r 206469 bytes 12:21 5 Jan 1995 qedit3c.zip

Количество найденных файлов и каталогов в ответе Archie можно ограничить командой set maxhits в письме запросе. Без этой команды письмо с результатами поиска может быть очень большим — особенно если вы ищете достаточно распро страненную программу или ваше ключевое слово встречается в именах файлов с разным содержимым (например, запрос «find tex» или «find win» вызовет настоящий обвал!).

Теперь с любого из найденных Archie узлов можно заказать сам QEdit — например, через один из серверов ftpmail (стр. 261). Адреса Archie серверов, доступных через электронную почту, приведены в приложении 4.8.

Поиск на Alta Vista

Alta Vista — одна из поисковых систем (иногда их называют еще автоматическим индексами) WWW, ориентированная, разумеет ся, на доступ в режиме online. Невероятных размеров база данных этой системы содержит тексты всех WWW документов, которые этой системе удалось разыскать и получить с WWW серверов все го мира, а вдобавок к этому еще и текст всех статей Usenet за по следние месяц полтора. Возможности поиска, которые дает доступ к Alta Vista или другим подобным системам (их существует уже немало), переоценить невозможно. И хотя процедура посылки запроса этой системе через электронную почту не отличается простотой и изяществом, потрудиться стоит — что бы вы ни искали, результаты наверняка превзойдут ваши самые смелые ожидания.

Как мы увидим в следующей главе, система WWW состоит из документов, каждый из которых имеет свой собственный уни кальный URL адрес (стр. 284). Запрос на поиск представляет со бой, по сути, обычный запрос документа, с той только разницей, что документ этот (содержащий результаты поиска), не сущест вует заранее, а будет сгенерирован в ответ на запрос. Вся информация о том, что именно вы хотите найти, в том числе ключевые слова и разнообразные опции поиска, вписывается прямо в адрес заказываемого документа. Таким образом, чтобы составить запрос, вам нужно знать две вещи: во первых, опции и параметры запроса данной поисковой системы, а во вторых, правила составления URL адресов.

К сожалению, синтаксис построения URL адресов слишком сложен, чтобы описывать его здесь в подробностях. Вместо этого мы рассмотрим конкретный пример, разобравшись в котором, вы сможете осуществлять несложный поиск самостоятельно. Подробнейшие сведения о работе через электронную почту со множеством поисковых систем и о том, как выяснить синтаксис запроса в общем случае на основе информации от самой поисковой системы, вы найдете в сборнике документов по адресу ftp://ftp.netcom. com/pub/gb/gboyd/wssearch. zip.

Допустим, нас интересует, нельзя ли найти в Интерн ете рус ский перевод рассказа Джерома Сэлинджера «Лапа растяпа». Ключевых слов здесь два — фамилия автора и заглавие рассказа, причем оба в нашем контексте, скорее всего, останутся неизме няемыми (т. е. у них не обязательно заменять окончание на сим вол *, чтобы отловить эти слова в разных формах). Вот как записывается URL адрес, по которому вам будет выдана страница результатов поиска:

http: //a Itav i sta.d i g i taI, сои/сд i b i n/query?pд=q&whatsweb&flIlt=. &Q::Cэлинджep+Лaпa pacтяпa

Левая часть адреса вплоть до вопросительного знака является неизменяемой и должна присутствовать в каждом запросе. Правая же часть состоит из пар имя= значение, соединенных между собой символами «&». Параметр what указывает, где будет производиться поиск: в текстах документов WWW («web») или в содержимом Usenet («news»). Сами ключевые слова записываются в параметре q; пробелы, недопустимые в URL адресе, заменяются при этом на символы «+».

Составив такой запрос, мы должны воспользоваться одним из webmail серверов (стр. 261). Пошлите, например, по адресу ago ra@dna.affrc.go.jp писФьмо с единственной строчкой:

send ^.ш1рег>

подставив вместо <пдреса> приведенный выше URL. В ответном письме вам придет HTML документ с результатом поиска на Alta Vista. Среди мешанины инструкции языка HTML вы должны отыскать в этом файле строку вида

Documents 1 10 of 13 matching the query, best matches first

котор;1я говорит о том, что всего документов с таким сочетанием слов найдено 13, из нпх первые 10 перечислены здесь же. Ниже распола гаются подробные сведения о каждом документе (здесь приведены только первые три из десяти):

<dtxa

hrBf="http://www.газ.ru/cgi bin/html KOI/SELINGER/sel_2.txt"><strong>flxepOM

Сэлинджер. Выше стропила, ^^1гопо></а><оа>Джером Сэлинджер. Выше стропила, плотники Повесть Лет двадцать тому назад, когда в громадной нашей семье вспыхнула эпидемия свинки, мою младшую сестренку<Ьг;>

^citexa nref^'http: //www. ras. ru/cgi bin/htnil KOI/SELINGER/sel_2.txt";' http://www.ras.ru/cgi bin/html KOI/SELINGER/sel_2.txt</a><font slze= 1>

size 122K 10 Aug 96</fontx/citexbr>

Pxdtxa

href "http://www.rac. ru/cgi bin/ht[nl KOI/STRUGACKIE/syinpad.txt/Piece80.02"X3trong>No

Title^/strongx/axdd>2. Картина в тайнике oambuk_2 ha 125500 09/04/95 Ростислав Самбук. 1. Шифрованный счет 2. Коллекция профессора Стаха 253,656 bytes in 2 files....<br>

<citexa href="http://www. ras. ru/cgi bin/html KOI/STRUGACKIE/sympad.txt/ Piece80.02">

http://www ras. ru/cgi bin/htinl KOI/STRUGACKIE/syinpad.txt/Piece80.02</axfont

size"1> •

size 80K 23 Apr 96<;/fontx/citexbr>

<Pxdtxa

href^'http^/www. ras. ru/moshkaw/html KOI/holy ftp, txt"xstrong>No Title</strongx/axdd>LEW PLEM.ARJ [004] К. С. Льюис "Племянник чародея" LEW SK.ARJ [001] К. С. Льюис

<cite><a href="http://www. ras. ru/itioshkow/htinl KOI/holy ftp.txt"> http://www. ras. ru/moshkow/html KOI/holy ftp.txK/axfont size= 1>size 94K 20 Sep 96</fontx/citexbr>

Для каждого документа приводятся его URL адрес (в виде href="адрес"), размер и дата занесения в базу, а также заголовок и первые несколько строк текста, по которым можно судить о его содержании. Как видите, на первое место вышел документ с тек стом (судя по размеру — 122 Кб — с полным текстом) другого произведения этого писателя (по видимому, из за того, что в нем единственном фамилия «Сэлинджер» стояла в заголовке).

Отсутствие в списке результатов искомого рассказа еще не означает, что наша попытка оказалась неуспешной. Искусство поиска информации в Интернете состоит из равных долей интуиции и опыта, подсказывающих, в каком направлении нужно сделать следующий шаг. В данном случае заказывать первый документ, очевидно, смысла нет — текст одной повести вряд ли будет содержать в себе ссылки на другие произведения писателя. В то же время есть определенная вероятность, что искомый текст лежит где то рядом с этой повестью — скорее всего, на том же сервере и в том же каталоге (раз каталог назван по имени писателя, он, наверное, содержит и другие его произведения). Поэтому стоит заказать с помощью того же webmail сервера документ по адресу

http://www.ras,ru/cgi bin/html KOI/SELINGER/

представляющий собой список всех файлов в каталоге /cgi bin/ html KOI/SELINGER на сервере www.ras.ru. Как и следовало ожидать, помимо файла sel_2.txt, там есть и sel_l.txt, и sel_3.txt, и sel_4.txt. Никаких пояснений к этим файлам нет, но теперь уже ничто не мешает выкачать все их по очереди и обнаружить, что файл sel_3.txt — это сборник рассказов Сэлинджера, среди ко торых есть и «Лапа растяпа».

Если же в первом документе с результатами поиска ничего интересного не нашлось, вы можете попросить Alta Vista подгото вить вам страницу со следующей десяткой результатов. Для этого к URL адресу запроса (стр. 266) следует добавить еще один параметр, приписав его через символ &:

stq=10

Третья, четвертая и т. д. порции результатов вызываются с помощью значений 20, 30 и т. д.

Вот еще один, взятый из жизни, пример поиска. Представьте, что вам срочно понадобился список названий всех стран мира на русском языке. Для этого случая подобрать ключевые слова не так то просто: ведь и «список», и «всех», и «стран» — слова чрезвычайно распространенные, и поиск даже с перечислением их всех вызовет обвал результатов. Кроме того, искомый текст

может ведь называться и не «список стран», а, скажем, «перечень государств». На первый взгляд проблема кажется неразрешимой.

Попробуем подойти к решению с другой стороны. Если спи сок содержит все страны мира, то он обязан включать в себя и названия малоизвестных, редко когда упоминаемых стран, — которые, таким образом, для нашего случая могут послужить ключевыми словами с высокой избирательностью.

Попробуем в качестве ключевого слова название государства «Антигуа и Барбуда». Чтобы сообщить поисковой системе, что эти три слова должны идти друг за другом именно в таком поряд ке, их нужно заключить в кавычки, а поскольку кавычки в URL адресе недопустимы, придется вместо кавычек использовать комбинацию символов «%22» (22 — шестнадцатеричный код символа "). Вот как будет выглядеть URL запроса:

http://altavista. digital .coл^/cg^ bln/query?Dg=(l&what=web&fл^t^.&q=»22Aнтигya+и+Бapбyдaft22

Наши ожидания блестяще оправдались — из трех документов, возвращенных сервером Alta Vista, второй по счету озаглавлен «Список поправок времени государств, территорий относительно г. Москвы» и действительно содержит полный список всех стран мира с указанием их поясного времени. Достаточно убрать лишнюю информацию — и' искомый документ у вас в руках.

Несколько слов о поиске русскоязычных документов. К сожалению, далеко не все поисковые системы (даже те, которые индексируют русскоязычные документы) позволяют задавать ключевые слова на русском языке (Alta Vista — редкое исключение).1 Но там, где это возможно, вы должны помнить о проблеме кодировок. Хотя большая часть информации в русском WWW продублирована в нескольких кодировках, обязательно включая КОИ8, существуют документы, представленные только в кодировке СР1251. Поэтому, если поиск по ключевым словам в КОИ8 не дал результата, можно попытаться отправить этот же запрос, но с ключевыми словами в СР1251. Страница с результатами такого поиска тоже придет к вам в кодировке СР1251.

Возможно, вам покажется более удобным читать документы, полученные с webmail сервера, в специально предназначенной для этого программе — в броузере WWW (стр. 287). К сожалению, современные броузеры слишком велики по объему, чтобы

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]