Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Ответы к экз.docx
Скачиваний:
102
Добавлен:
28.12.2014
Размер:
1.91 Mб
Скачать

6 Системы мета-поиска

Для быстрого поиска в базах сразу нескольких поисковых систем лучше обратиться к системам мета-поиска.

Системы мета-поиска – это поисковые машины, которые посылают Ваш запрос на огромное количество разных поисковых систем, затем обрабатывают полученные результаты, удаляют повторяющиеся адреса ресурсов и представляют более широкий спектр того, что представлено в сети Интернет.

Наиболее популярная в мире система мета-поиска Search.com.

Русскоязычная мета система- Нигма.

Далее мы будем, в основном, рассматривать ИПС для всемирной паутины (WWW). Основными показателями ИПС для WWW являются пространственный масштаб и специализация.

По пространственному масштабу ИПС можно разделить на локальные, глобальные, региональные и специализированные. Локальные поисковые системы могут быть разработаны для быстрого поиска страниц в масштабе отдельного сервера.

Региональные ИПС описывают информационные ресурсы определенного региона, например, русскоязычные страницы в Интернете. Глобальные поисковые системы в отличие от локальных стремятся объять необъятное – по возможности наиболее полно описать ресурсы всего информационного пространства сети Интернет.

Кроме того, ИПС также могут специализироваться по поиску различных источников информации, например, документов WWW, файлов, адресов и т.д.

Рассмотрим подробнее основные задачи, которые должны решить разработчики ИПС. Как следует из определения, ИПС для WWW проводят поиск в собственной базе (индексе) с описанием распределенных источников информации.

Следовательно, сначала нужно описать информационные ресурсы и создать индекс. Построение индекса начинается с определения начального набора URL источников информации. Затем проводится процедура индексирования.

Индексирование – описание источников информации и построение специальной базы данных (индекса) для эффективного поиска.

В некоторых информационно-поисковых системах описание источников информации проводится людьми, которые составляют краткую аннотацию на каждый ресурс. Затем, как правило, проводится сортировка аннотаций по темам (составление тематического каталога). описание, составленное человеком, будет совершенно адекватно источнику, но процедура описания занимает значительный период времени, поэтому формируемый индекс имеет, как правило, ограниченный объем.

В ИПС второго типа процедура описания информационных ресурсов автоматизирована. Для этого разрабатывается специальная программа-робот, которая по определенной технологии обходит ресурсы, описывает их (проводит индексирование) и анализирует ссылки с текущей страницы для расширения области поиска. Как может описать документ программа? Чаще всего просто составляется список слов, которые встречаются в тексте и других частях документа, при этом учитывается частота повторения и местоположение слова, то есть, слову приписывается своеобразный весовой коэффициент в зависимости от его значимости. Например, если слово находится в названии Web-страницы, робот пометит этот факт для себя. Поскольку описание автоматизировано, затраты времени невелики, и индекс может оказаться очень большим по размеру.

Следовательно, следующей задачей для ИПС второго типа является разработка робота-индексировщика. Для поиска в системах данного типа пользователю придется научиться составлять запросы, в простейшем случае состоящие из нескольких слов. Тогда ИПС будет искать в своем индексе документы, в описаниях которых встречаются слова из запроса. Для проведения более качественного поиска необходимо разрабатывать специальный язык запросов для пользователя. В зависимости от особенностей построения модели индекса и поддерживаемого языка запросов разрабатывается механизм поиска и алгоритм сортировки результатов поиска. Поскольку индекс имеет значительный объем, количество найденных документов может оказаться достаточно большим. Следовательно, чрезвычайно важно, как поисковая машина проведет поиск и отсортирует его результаты.

Не последнее значение имеет внешний вид поисковой системы, предстающий перед пользователем, поэтому одной из задач является разработка удобного и красивого интерфейса. Наконец, исключительно важна форма представления результатов поиска, поскольку пользователю необходимо узнать как можно больше о найденном источнике информации, чтобы принять правильное решение о необходимости его посещения.

Для обращения к поисковому серверу пользователь использует стандартную программу-клиент для всемирной паутины, то есть браузер. По адресу домашней страницы ИПС пользователь работает с интерфейсом поисковой системы, который служит для общения пользователя с поисковым аппаратом системы (системой формирования запросов и просмотра результатов поиска).

  1. Основные сервисы (службы Интернета), их классификация.

Под сервисами или службами Интернет обычно понимаются те виды услуг, которые оказываются серверами, входящими в сеть. Каждый сервис уникален и одновременно неотделим от остальных, поэтому нельзя ввести сколько-нибудь жесткую или определенную классификацию. Каждый сервис характеризуется свойствами, часть которых объединяет его с одной группой сервисов, а другая часть с другой группой.

Рис. 3. Классификация типов сервисов Интернет

Сервисы, относящиеся к классу Отложенного чтения, наиболее распространены, наиболее универсальны и наименее требовательны к ресурсам компьютеров и линиям связи. Основным признаком этой группы является та особенность, что запрос и получение информации могут быть достаточно сильно разделены по времени. Сюда относится, например, электронная почта.

Сервисы прямого обращения характерны тем, что информация по запросу возвращается немедленно. Однако от получателя информации не требуется немедленной реакции.

Сервисы, где требуется немедленная реакция на полученную информацию, т.е. получаемая информация является, по сути дела, запросом, относятся к интерактивным сервисам. Для пояснения вышесказанного можно заметить, что в обычной связи аналогами сервисов интерактивных, прямых и отложенного чтения являются, например, телефон, факс и письменная корреспонденция.

Социальные сервисы - сетевое программное обеспечение, поддерживающее групповые взаимодействия.

  1. Облачные сервисы: виды, применение.

??? Можно ли обеспечить для элементов этой системы взаимодействие по единым правилам?

Возможности облачных сервисов:

  1. Хранение информации (Google-disk,Yandex-disk, …)

+:

  • резервное хранение (компьютер вышел из строя, но инфа не пропадет)

  • синхронизация изменений (любые изменения распространяются на все включенные условия

  • усиленная защита

–:

  • утечка инфы, высокая незащищенность данных

  • хакеры

  1. «Облачные вычисления»

Доступ к ПО

Модели:

  1. доступ к определенным программам (пр-р: обеспечение как услуга) + можно не покупать ПО, а арендовать на некоторое время + можно протестировать перед покупкой

  2. Платформа как услуга (ОС, средства тестирования или отладки) + аналогичны + пункта а

MS365 Доступ круга пользователей к редактированию документов

  1. Услуга как рабочий стол

  2. инфраструктура как услуга (работа всех участников фирмы в рамках облачной системы)

Итак, решаем, пользоваться или нет: + и -:

+легальное ПО

+Выход с любого устройства, подключенного к Интернет

+низкие требования к устройству

+резервное хранение данных

+синхронизация данных

+возможность использования мощного профессионального ПО на простом оборудовании

-невозможность контролировать действия 3их лиц

-выход только при подключении к Интернет

-Пользование услуг конкретного владельца

-периодическая необходимость оплаты

  1. Информационные ресурсы интернет. Всемирная паутина WWW. Классификация сайтов.

Классификация информационных ресурсов интернет

Мировые информационные ресурсы обычно подразделяются на три сектора:

- сектор деловой информации;

- сектор научно-технической и специальной информации;

- сектор массовой потребительской информации.

Сектор научно-технической и специальной информации включает: документальную, библиографическую, реферативную и полнотекстовую информацию о фундаментальных и прикладных исследованиях и профессиональную информацию для юристов, врачей, инженеров и остальных групп.

Сектор массовой потребительской информации включает новости и справочную информацию, потребительскую развлекательную информацию.

Можно рассматривать WWW как единое распределенное информационное пространство, состоящее из сотен миллионов гипермедийных документов.

Понятие гипермедиа означает объединение двух понятий: мультимедиа и гипертекст.

Мультимедиа – документ включает в себя не только текст, но и двух- и трехмерную графику, видео и звук.

Информация в WWW представляется в виде документов, каждый из которых может содержать как внутренние перекрестные ссылки, так и ссылки на другие документы, хранящиеся на том же самом или на любом другом сервере.

Гипертекст – множество отдельных документов (страниц), которые имеют ссылки друг на друга. Гипертекстовая ссылка – выделенная часть документа, реализующая переход к другому документу. Реализуется в виде подчеркнутого текста, кнопки или картинки.

Все пространство WWW состоит из документов, называемых Web-страницами.

Web-страница – документ в WWW, содержащий:

  • форматированный текст;

  • мультимедийные объекты (графика, звук, музыка, видеоклипы);

  • ссылки на любой файл или на другую Web-страницу;

  • активные компоненты, способные выполнять работу на компьютере клиента по заложенной в них программе.

Пожалуй, в рамках одной единственной страницы трудно изложить информацию даже об отдельной личности, поэтому, как правило, информацию представляют в виде набора из нескольких десятков или сотен, связанных вместе единой темой, общим стилем оформления и взаимными гипертекстовыми ссылками. Такой набор называется Web-site или Web-узел.

Web-site (Web-узел, Web-сайт) – группа Web-страниц, связанных вместе единой темой, общим стилем оформления и взаимными гипертекстовыми ссылками.

Каждый Web-узел имеет свою стартовую страницу, которая называется начальной или домашней или Home Page.

Home Page – начальная (домашняя) страница какого-либо Web-узла.

Обычный Web-узел отправляет запрошенный документ только по обращению клиента. В WWW существуют Web-узлы, способные самостоятельно передавать обновленную информацию при условии регистрации и подписки клиента.

Web-канал – Web-узел, способный автоматически в заданное время передавать обновленную информацию на компьютер зарегистрированного клиента.

Рассмотрим, как реализована технология клиент/сервер применительно к всемирной паутине. Для полной характеристики ресурса нужна связка клиент-сервер-прикладной протокол. Многочисленные Web-узлы и Web-страницы хранятся на огромном множестве так называемых WWW-серверов, то есть компьютеров, на которых установлено специальное программное обеспечение.

Web-сервер – программа, позволяющая хранить и пересылать Web-страницы. Пользователи, имеющие доступ к сети, получают эту информацию при помощи программ-клиентов для просмотра Web-документов, которые получили специфическое название Web-браузеры (броузеры, обозреватели).

Web-browser (браузер) – программа-клиент для навигации в WWW и просмотра Web-страниц.

При этом браузер посылает по компьютерной сети запрос Web-серверу, хранящему файл с необходимым документом. В ответ на запрос сервер высылает программе просмотра требуемый файл или сообщение об отказе, если файл по тем или иным причинам недоступен. Взаимодействие клиент-сервер происходит по определенным правилам, или, как говорят иначе, по прикладному протоколу. Протокол, принятый в WWW, называется HyperText Transfer Protocol, сокращенно – HTTP.

HTTP (HyperText Transfer Protocol, протокол передачи гипертекста) – протокол, который использует Web-клиент для получения Web-страницы с Web-сервера. Этот протокол для передачи гипертекста в Сети был предложен швейцарским физиком Тимом Бернерсом-Ли (Tim Berners-Lee) в 1989 году.

Пользователь на своем компьютере запускает программу-клиент для всемирной паутины (браузер) и вводит запрос к серверу в виде адреса конкретной размещенной на нем Web-страницы. Запрос, преобразованный с помощью протокола HTTP, передается серверу,который высылает желаемый документ по протоколу HTTP. Получив Web-страницу, браузер показывает ее пользователю.

WWW-документ может содержать стилизованный и форматированный текст, графику и гиперсвязи с различными ресурсами Internet. Чтобы реализовать все эти возможности, был разработан специальный язык, названный HyperText Markup Language (HTML), то есть, Язык Разметки Гипертекста.

HTML (HyperText Markup Language, язык разметки гипертекста) –специальный язык описания WWW-документов. Описание Web-страницы на HTMLпредставляет собой набор инструкций, интерпретируемый программой-браузером.

Документ, написанный на HTML, представляет собой текстовый файл,содержащий собственно текст, несущий информацию читателю, и теги разметки (markuptags). Последние представляют собой определенные стандартом HTML последовательности символов, являющиеся инструкциями для программы просмотра; согласно этим инструкциям программа располагает текст на экране, включает в него рисунки, хранящиеся в отдельных графических файлах, и формирует гиперсвязи с другими документами или ресурсами Internet. Таким образом, файл на языке HTML приобретает облик Web-документа только тогда, когда он интерпретируется браузером.

Всем пользователям компьютера хорошо знакомо понятие полного имени файла на локальном компьютере, которое включает в себя краткое имя файла с расширением и полный путь к файлу, начиная с имени устройства. Таким образом, мы однозначно идентифицируем файл в пределах данного компьютера.

Каждый файл в Интернете также имеет свой уникальный адрес. Он называется URL. URL (Universal Resource Locator, универсальный указатель ресурсов) – адрес любого файла в Интернете. Кроме адреса компьютера содержится указание о протоколе, по которому нужно обращаться к файлу, какую программу-сервер на сервере запустить и к какому конкретному файлу следует обратиться.

Общий вид URL:

протокол://адрес_сервера:порт/имя_каталога/имя_файла

Рассмотрим примеры URL:

http://www.microsoft.com – обращение по протоколу HTTP к начальной (домашней) странице Web-сервера коммерческой фирмы Microsoft в США. Здесь самый левый домен в адресе www сразу указывает на тип информации.

ftp://www.comp.ru/business/index.html – адрес файла index.html, расположенного в каталоге business на сервере www.comp.ru в России, к которому нужно обращаться по протоколу передачи файлов ftp.

Классификация сайтов (Web ресурсов)

Web ресурсы (сайты) классифицируются на 2 группы: навигационные сайты (перенаправляют пользователей к конечным сайтам) и конечные (функциональные) сайты (содержат информацию или документы, которые необходимы пользователям).

Рис. 4 Схема классификации Web ресурсов

 

Интернет каталог— Большие сайты справочно-информационного характера, на которых пользователи могут найти сайты нужной тематики. В каталоге пользователь сам ищет нужный ресурс, выбирая нужные рубрики.

Каталог ресурсов интернет (англ. web directory) — структурированный набор ссылок на сайты с кратким их описанием. Сайты внутри каталога разбиваются по темам, а внутри тем могут быть ранжированы или по определенному индексу или по дате добавления, или по алфавиту, или по другому параметру. Это один из старейших сервисов Интернета.

Поиско́вая систе́ма— программно-аппаратный комплекс свеб-интерфейсом, предоставляющий возможность поискаинформациивИнтернете. Под поисковой системой обычно подразумеваетсясайт, на котором размещён интерфейс системы. Программной частью поисковой системы являетсяпоисковая машина(поисковый движок) —комплекс программ, обеспечивающий функциональность поисковой системы и обычно являющийся коммерческой тайной компании-разработчика поисковой системы

Портал – это Web сайт, сочетающий в себе функции навигационного сайта и информационного ресурса по различным темам.

Информационные сайты - обеспечивают доступ пользователей к документам определенной тематики.

Корпоративные сайты, а так же сайты электронной коммерции – дают доступ к коммерческой информации (информации о товарах, услугах, производителях), а также возможность удаленного заказа, оплаты и приобретения товаров и услуг.

Web интерфейс– это сайты, которые через стандартные Web страницы предоставляют доступ к сервисам Internet (электронной почты, телеконференций и другим).

  1. Основные возможности браузеров. Просмотр и сохранение информации.

Веб-обозрева́тель, бра́узер (от английского Web browser; вариант броузер — устаревшая форма) - программное обеспечение для просмотра веб-сайтов, то есть для запроса веб - страниц преимущественно из сети), их обработки, вывода и перехода от одной страницы к другой.

Ныне браузер — комплексное приложение для обработки и вывода разных составляющих веб-страницы и для предоставления интерфеса между веб-сайтом и его посетителем. Практически все популярные браузеры распространяются бесплатно или «в комплекте» с другими приложениями:

в 1996 году был разработан Internet Explorer, браузер корпорации Microsoft;

Так же популярны браузеры: Mozilla Firefox (бесплатно, свободное ПО); Safari (бесплатно для Microsoft Windows); Opera (бесплатно начиная с версии 8.50); Google Chrome (бесплатно).

В настоящее время Протокол HTTP, язык разметки гипертекстов HTML, браузеры и веб-серверы беспрестанно совершенствуются, открывая перед своими пользователями все новые и новые возможности.

Сначала пользователь в специальном адресном поле, которое называется Адрес или Location, вводит адрес (URL) ресурса, к которому хочет получить доступ.

Если все в порядке, адрес правильный, сервер работает и требуемый файл на нем имеется, вам через некоторое время в зависимости от качества вашего подключения доставят страницу и браузер постарается ее отобразить в главном окне.

Далее все определяется содержимым Web-документа. Содержащиеся в полученной веб-странице текстовые гиперссылки, как правило, выделяются другим цветом и подчеркиваются.

Ссылки, указывающие на ресурсы, которые пользователь еще не просматривал, и ссылки на уже посещенные ресурсы обычно имеют разный цвет. В качестве гиперссылки могут служить рисунки и всевозможные кнопки. Отличительной особенностью ссылки является превращение курсора мыши в указующий перст при наведении на гиперссылку. При этом в строке состояния браузера появится адрес, на который указывает ссылка.

Это замечательно, поскольку по адресу можно сразу сориентироваться, находится ли ресурс на том же сервере или нет, а также определить действие по выбору гиперссылки. Если это ссылка на Web-страницу, она будет загружена вместо текущей. Таким образом, выбирая щелчком мыши заинтересовавшие вас ссылки, вы совершаете навигацию или путешествие по всемирной паутине.

При этом браузер на всякий случай сохраняет файлы с просмотренных страниц в специально отведенном на диске локального компьютера месте, называемом дисковым кэшем. Именно по этой причине у вас есть возможность быстрого перехода между посещенными в данном сеансе станицами с помощью кнопок Назад (Back) или Вперед (Forward), имеющимися в наличии у любого браузера.

В общем случае гиперссылки могут указывать на документы разных типов. Если ссылка указывает на html-документ, он будет загружен в текущем окне браузера. Если ваш браузер не способен отображать файлы определенного типа, например, архивные файлы в формате *.ZIP, при щелчке на ссылку вида http://www.it.belsut.gomel.by/~kit/kit_lab1.zip запускается мастер загрузки файла, предлагающий открыть файл или сохранить его на локальном диске. Поскольку открытие означает возможный запуск файла, если он является исполняемым, надежнее выбрать сохранение файла на диске. После указания папки, в которой сохранять файл, начнется процесс загрузки, который идет параллельно работе других приложений.

Браузер может работать не только с Web-серверами, но и с серверами сервиса FTP. Поэтому при выборе ссылки вида ftp://ftp.it.belsut.gomel.by в текущем окне откроется содержимое папки FTP-архива файлов. Как правило, вместе с браузером на компьютер обычно устанавливается программа-клиент для пользования электронной почтой и чтения новостей. Поэтому, если ссылка выглядит как mailto:Webmaster@it.belsut.gomel.by, при ее выборе запускается прописанный в браузере почтовый клиент, и Вы сможете написать электронное письмо по указанному в ссылке адресу.

При выборе ссылки вида news://it.belsut.gomel.by запускается программа-клиент для чтения новостей с предложением загрузить список групп новостей, поддерживаемых сервером.

Если загруженная Web-страница отображается неправильно или не полностью, и его перезагрузка (с помощью кнопки Обновить) не помогает, то один из возможных источников проблем – несовместимость загружаемого вами документа с типом или версией браузера, которым вы пользуетесь.

Сохранение информации

Как уже известно, Web-страница – это, документ, написанный на языке HTML, который просто интерпретируется браузером. При попытке посмотреть исходный текст Web-страницы, вы увидите набор команд (тегов), указывающих либо на способ отображения текста, либо содержащие ссылки на внешние мультимедийные файлы. Именно поэтому до недавнего времени стандартной командой Файл / Сохранить как... нельзя было сохранить полностью всю Web-страницу на локальном диске для последующего просмотра в автономном режиме, то есть при отключении от сети.

В настоящий момент браузеры сохраняют Web-страницу целиком, создавая для нее на локальном диске специальную папку, куда переписываются все файлы со страницы.

Некоторые серверы подкачивают информацию на страницу динамически из базы данных. В этом случае самым надежным способом сохранения нужной информации является предварительное ее выделение протяжкой мыши и последующее копирование в буфер обмена командой Правка / Копировать.

Из буфера обмена информацию можно немедленно вставить в документ процессора MS Word. Тогда вы сразу увидите результаты копирования и гарантированно сохраните информацию в MS Word в нужно м вам формате.

Для сохранения отдельных мультимедийных объектов нужно использовать команду Сохранить из контекстного меню, вызванного для данного объекта.

Основными графическими форматами в Интернете являются GIF и JPEG (расширения файлов *.GIF и *.JPG).

Эти форматы используют специальные архиваторы для значительного сжатия информации, поэтому размер GIF-файла существенно меньше размера графического файла в формате Windows BMP. Просматривать сохраненный рисунок можно с помощью браузера или мощного графического редактора, понимающего указанные форматы.

  1. Компьютерная графика. Воспроизведение цвета; параметры изображений на экране и при печати.

У практики отображения информации в графическом виде много синонимов, но в последнее время чаще всего используются два — визуализация данных и инфографика.

Визуализация даных - это отображение больших массивов числовой и семантической информации в виде графических объектов. Продукты визуализации данных предназначены для дальнейшей интеграции в информационные системы и системы поддержки принятия решений.

Визуализация данных находит применение в самых разных сферах человеческой деятельности. Для примера назовем медицину (компьютерная томография), научные исследования (визуализация строения вещества, векторных полей и других данных), моделирование тканей и одежды, опытно-конструкторские разработки, статистика и отчеты и др.

КОМПЬЮТЕРНАЯ ГРАФИКА

Существует специальная область информатики, изучающая методы и средства создания и обработки изображений с помощью программно-аппаратных вычислительных комплексов, – компьютерная графика, получившая развитие в середине 50-х годов для больших ЭВМ, применявшихся в научных и военных исследованиях. С тех пор графический способ отображения данных стал неотъемлемой принадлежностью подавляющего числа компьютерных систем, в особенности персональных. Графический интерфейс пользователя сегодня является стандартом для программного обеспечения разных классов, начиная с операционных систем.

Графический редактор - программа (или пакет программ), позволяющая создавать и редактировать двух- и трёхмерные изображения с помощью компьютера. Современные графические редакторы изображений используются как программы для рисования с нуля, и как программы для редактирования фотографий.

В зависимости от способа формирования изображений компьютерную графику принято подразделять на растровую, векторную и фрактальную.

Рис. 1. Различные виды графики.

Отдельным предметом считается трехмерная (3D) графика, изучающая приёмы и методы построения объемных моделей объектов в виртуальном пространстве. Как правило, в ней сочетаются векторный и растровый способы формирования изображений.

Особенности цветового охвата характеризуют такие понятия, как чёрно-белая и цветная графика. На специализацию в отдельных областях указывают названия некоторых разделов: инженерная графика, научная графика, Web-графика, компьютерная полиграфия и прочие.