Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
I часть.doc
Скачиваний:
33
Добавлен:
16.08.2019
Размер:
879.62 Кб
Скачать

2.2 Гипертекстовая технология

В 1945 г. В. Буш, научный советник президента Г. Трумэна, проанализировав способы представления информации в виде отчетов, докладов, проектов, графиков, планов и поняв неэффективность такого представления, предложил способ размещения информации по принципу ассоциативного мышления. На базе этого принципа была разработана модель гипотетической машины МЕМЕКС. Через 20 лет Т. Нельсон реализовал этот принцип на ЭВМ и назвал его гипертекстом.

Обычно любой текст представляется как одна длинная строка символов, которая читается в одном направлении. Гипертекстовая технология заключается в том, что текст представляется как многомерный, т.е. с иерархической структурой типа сети. Материал текста делится на фрагменты. Каждый видимый на экране ЭВМ фрагмент, дополненный многочисленными связями с другими фрагментами, позволяет уточнить информацию об изучаемом объекте и двигаться в одном или нескольких направлениях по выбранной связи.

Гипертекст обладает нелинейной сетевой формой организации материала, разделенного на фрагменты, для каждого из которых указан переход к другим фрагментам по определенным типам связей [21]. При установлении связей можно опираться на разные основания (ключи), но в любом случае речь идет о смысловой, семантической близости связываемых фрагментов. Следуя указанным связям, можно читать или осваивать материал в любом порядке, а не в единственном. Текст теряет свою замкнутость, становится принципиально открытым, в него можно вставлять новые фрагменты, указывая для них связи с имеющимися. Структура текста не разрушается, и вообще у гипертекста нет априорно заданной структуры. Таким образом, гипертекст - это новая технология представления неструктурированного свободно наращиваемого знания. Этим он отличается от других моделей представления информации.

Под гипертекстом понимают систему информационных объектов (статей), объединенных между собой направленными связями, образующими сеть. Каждый объект связывается с информационной панелью экрана, на которой пользователь может ассоциативно выбирать одну из связей. Объекты не обязательно должны быть текстовыми, они могут быть графическими, музыкальными, с использованием средств мультипликации, аудио- и видеотехники. Обработка гипертекста открыла новые возможности освоения информации, качественно отличающиеся от традиционных. Вместо поиска информации по соответствующему поисковому ключу гипертекстовая технология предполагает перемещение от одних объектов информации к другим с учетом их смысловой, семантической связанности. Обработке информации по правилам формального вывода в гипертекстовой технологии соответствует запоминание пути перемещения по гипертекстовой сети.

Гипертекстовая технология ориентирована на обработку информации не вместо человека, а вместе с человеком, т е. становится авторской. Удобство ее использования состоит в том, что пользователь сам определяет подход к изучению или созданию материала с учетом своих индивидуальных способностей, знаний, уровня квалификации и подготовки. Гипертекст содержит не только информацию, но и аппарат ее эффективного поиска. По глубине формализации информации гипертекстовая технология занимает промежуточное положение между документальными и фактографическими информационными системами.

Структурно гипертекст состоит из информационного материала, тезауруса гипертекста, списка главных тем и алфавитного словаря.

Информационный материал подразделяется на информационные статьи, состоящие из заголовка статьи и текста. Заголовок содержит тему или наименование описываемого объекта. Информационная статья содержит традиционные определения и понятия, должна занимать одну панель и быть легко обозримой, чтобы пользователь мог понять, стоит ли ее внимательно читать или перейти к другим, близким по смыслу статьям. Текст, включаемый в информационную статью, может сопровождаться пояснениями, примерами, документами, объектами реального мира. Беглый просмотр текста статьи упрощается, если эта вспомогательная информация визуально отличается от основной, например подсвечена или выделена другим шрифтом.

Тезаурус гипертекста - это автоматизированный словарь, отображающий семантические отношения между лексическими единицами дескрипторного информационно-поискового языка и предназначенный для поиска слов по их смысловому содержанию. Термин тезаурус был введен в XIII в. флорентийцем Б. Лотики для названия энциклопедии. С латыни это слово переводится как сокровище, запас, богатство. Тезаурус гипертекста состоит, из тезаурусных статей. Тезаурусная статья имеет заголовок и список заголовков родственных тезаурусных статей, где указаны тип родства и заголовки тезаурусных статей. Заголовок тезаурусной статьи совпадает с наименованием информационной статьи и является наименованием объекта, описание которого содержится в информационной статье. В отличие от традиционных тезаурусов-дескрипторов тезаурус гипертекста содержит не только простые, но и составные наименования объектов. Формирование тезаурусной статьи гипертекста означает индексирование текста. Полнота связей, отражаемых в тезаурусной статье, и точность установления этих Связей в конечном итоге определяют полноту и точность поиска при обращении к данной статье гипертекста. Существуют следующие типы родства или отношений: вид - род, род - вид, предмет - процесс, процесс - предмет, целое - часть, часть- целое, причина- следствие, следствие - причина и т. д. Пользователь получает более общую информацию по родовому типу связи, а по видовому - специфическую информацию без повторения общих сведений из родовых тем. Тем самым глубина индексирования текста зависит от родовидовых отношений. Список заголовков родственных тезаурусных статей представляет собой локальный справочный аппарат, в котором указываются ссылки только на ближайших родственников. Тезаурус гипертекста можно представить в виде сети: в узлах находятся текстовые описания объекта (информационные статьи), ребра сети указывают на существование связи между объектами и на тип родства. В гипертексте поисковый аппарат не делится на тезаурус и массив поисковых образов—документов, как в обычных информационно-поисковых системах. В гипертексте весь поисковый аппарат реализуется как тезаурус гипертекста.

Список главных тем содержит заголовки всех справочных статей, для которых нет ссылок типа род - вид, часть - целое. Желательно, чтобы список занимал не более одной панели экрана.

Алфавитный словарь включает в себя перечень наименований всех информационных статей в алфавитном порядке.

Гипертекстовая технология дала возможность структурированного представления любого текста, в котором автор может выделить несколько уровней детализации сигнала.

2. HTML

HTML также называют языком гипертекстовой разметки. Собственно, по-английски он и есть HyperText Markup Language

Начало истории HTML следует отнести к 1969 году, когда Чарльз Гольдфарб, работавший тогда в компании IBM, создал прототип языка для разметки технической документации, впоследствии названного GML, в 1986 году статуса международного стандарта — SGML (Standard Generalized Markup Language). Этот обобщенный метаязык предназначен для построения систем логической, структурной разметки любых разновидностей текстов.

Сам по себе SGML есть не готовая система разметки текста, а лишь удобный метаязык, позволяющий строить такие системы для конкретных обстоятельств. Стандарт SGML устанавливает лишь синтаксис записи элементов разметки, а также правила определения новых элементов и указания структурных отношений между ними. Для практической же разметки документов нужно приложение SGML — набор определений элементов, представляющий собой, по сути, формальное описание структуры документа.

В 1991 г. сотрудники Европейского института физикичастиц (CERN), занятые созданием системы передачи гипертекстовой информации через Интернет, не выбрали SGML в качестве основы для нового языка разметки гипертекстовых документов. Этот язык — самое известное из приложений SGML — был назван HTML (HyperText Markup Language, «язык разметки гипертекста»).

Изначально HTML, как и положено SGML-приложению, разделял все особенности идеологии SGML. Из сорока с небольшим тегов HTML версии 1.2 (датированной июнем 1993 г.), он содержал всего три тега. Вся разметка была чисто логической.

В в апреле 1994 г. началась подготовка спецификации следующей версии языка — 2.0. Этим занимался образованный в том же году Консорциум W3 (W3 Consortium, сокращенно W3C), перенявший от CERN верховную власть и авторитет в мире WWW.

Достаточно сказать, что спецификация HTML 2.0, единственным серьезным усовершенствованием в которой был механизм форм для отсылки информации с компьютера пользователя на сервер, была окончательно утверждена лишь в сентябре 1995 г., когда в W3C уже полным ходом шло обсуждение HTML 3, — или, как его называли поначалу, «HTML+».

Работа над ним началась в марте 1995 г., и первоначальный вариант стандарта включал в себя много интересных нововведений — теги для создания таблиц, разметки математических формул, вставки обтекаемых текстом рисунков, примечаний и др.

Но самое главное — HTML 3 был попыткой разрешить уже достаточно очевидное к тому времени противоречие между идеологией структурной разметки и потребностями пользователей, заинтересованных в первую очередь в гибких и богатых возможностях визуального представления. Противоречие это было разрешено опять-таки в полном соответствии с идеологией SGML: W3C ввел в HTML 3 поддержку так называемых иерархических стилевых спецификаций. Система CSS формально независима от HTML, имеет совершенно иной синтаксис, не наследует никаких идеологических ограничений и позволяет, уже в совершенно иных терминах, задавать параметры графического (так же как и текстового, звукового и какого угодно другого) представления для любого тега HTML.

Проект HTML 3 был заморожен, а вместо него в сжатые сроки создан стандарт HTML 3.2, который, по сути, всего лишь описывает большинство расширений Netscape (с тем же успехом их можно назвать теперь «расширениями Microsoft»). Пройдя обычный в W3C процесс обсуждения и внесения поправок, спецификация HTML 3.2 была утверждена в январе 1997 года.

В декабре того же 1997 г., с принятием стандарта HTML 4.0, эта версия ввела немало расширений для поддержки многоязычных документов и обеспечения доступности документа в разных средах. Кроме того, в HTML 4 наконец-то прямо в тексте стандарта четко проведено разделение логических и визуальных тегов (последние объявлены «нерекомендованными», «deprecated»).

СИНТАКСИС

Символы, заключенные в угловые скобки <> являются HTML командами, по которым “браузер” распознает, как следует преобразовать части текста, заключенные между этими командами.

Документ в целом должен быть отмечен как документ в формате HTML. Для этого он должен начинаться командой <HTML> и заканчиваться командой </HTML>.

Документ состоит из 2 частей:

Заголовка (Head),

Собственно документа (Body).

Каждый WWW - документ имеет название, которое вводится в титульной строке “браузера”.

Для ввода титульной строки в заголовок документа следует воспользоваться следующими командами: <HEAD> <TITLE> TITLE List </TITLE> </HEAD>

Для записи основного текста следует ввести: <BODY> Основной текст </BODY>

Таким образом, общая схема документа в формате HTML выглядит следующим образом:

<HTML>

<HEAD> <TITLE> Титульная строка документа </TITLE> </HEAD>

<BODY> Основной текст документа </BODY>

</HTML>

При написании команд HTML не имеет значение, какими буквами - строчными или прописными Вы пишете команды.

Содержимое тега title

Тег <TITLE> и обязательный парный ему </TITLE>

Элемент TITLE не является частью отображаемого текста. Он может отображаться, например, как заголовок страницы или название окна. Только один TITLE может быть в документе. Элемент TITLE должен использоваться для идентификации содержимого документа. Поскольку пользователи часто обращаются к документам вне контекста, авторы должны предоставлять осмысленные заголовки. Таким образом, вместо такого заголовка, как "Введение", который не даёт достаточно информации о документе, авторы должны записать, например, так: "Введение в HTML". Название должно быть не более 40 символов, т.к. название, превышающее размер в 40 символов не помещается в строку заголовка окна браузера.

Следует отметить, что титульная строка должна быть на английском языке в латинской кодировке так как она отображается в специальных полях браузера.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]