Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
3 Об SGML и HTML.doc
Скачиваний:
2
Добавлен:
22.11.2019
Размер:
330.75 Кб
Скачать

3 Об SGML и HTML

Содержание

  1. Введение в SGML

  2. Конструкции SGML используемые в HTML

    1. Элементы

    2. Атрибуты

    3. Указатели символов

    4. Коментарии

  3. Как читать HTML DTD

    1. Коментарии DTD

    2. Определения параметрических сущностей

    3. Декларации элементов

      • Определения модели содержания

    4. Декларации атрибутов

      • Сущности DTD в определениях атрибутов

      • Булевы атрибуты

Настоящий раздел документа представляет SGML и обсуждает его отношение к HTML. Полное обсуждение SGML опущено в пользу стандарта (см. [ISO8879]).

3.1 Введение в sgml

SGML представляет собой систему для определения языков разметки. Авторы размечают свои документы представляя структурную, художественную и семантическую информацию по ходу содержания. HTML представляет конкретный пример языка разметки. Приведем пример документа написанного на HTML:

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0//EN"

"http://www.w3.org/TR/REC-html40/strict.dtd">

<HTML>

<HEAD>

<TITLE>Мой первый документ на HTML</TITLE>

</HEAD>

<BODY>

<P>Hello world!

</BODY>

</HTML>

Документ написанный на HTML разделяется на заголовок (в данном примере, между <HEAD> и </HEAD>) и тело (в данном примере, между <BODY> and </BODY>). Название документа приводится в заголовке (вместе с другой информацией о документе), а содержание документа приводится в теле. Тело в данном примере содержит лишь один абзац, помеченый ярлыком <P>.

Каждый язык разметки сформулированый в терминах SGML называется приложением SGML. Как правило, приложение SGML характеризуется следуюшим:

  1. Декларация SGML. Декларация SGML указывает какие символы и ограничители могут встречатся в приложении.

  2. Определение типа документа (DTD, document type definition). The DTD синтаксис конструкций разметки. DTD может включать дополнительные определения, такие как указатели символьных сущностей.

  3. Спецификация описывающая семантику которая должна быть приписана с разметке. Эта спецификация так-же нанлагает синтаксические ограничения которые не могут быть выражены в рамках DTD.

  4. Экземпляры документы, содержащие данные (содержание) и разметку. Каждый экземпляр содержит ссылку на DTD которое следует использовать при его интерпретации.

Спецификация HTML 4.0 включает декларацию SGML, три определения типа документа (описание см. в разделе информация о версии HTML) и список указателей символов.

3.2 Конструкции sgml используемые в html

Следующие разделы представляют конструкции SGML используемые в HTML.

В приложении перечислены некоторые черты SGML которые не получили широкой поддержки в редакторах HTML и стедствах просмотра и использования которых следует избегать.

3.2.1 Элементы

Определение типа документа (DTD) SGML объявляет типы элементов что представляют труктуры или желаемое поведение. HTML включает типы элементов для представления абзацев, гипертекстовых ссылок, списков, таблиц, изображений, и т.д.

Каждое объявление типа элемента как правило описывает три части: начальный ярлык, содержание и заключительный ярлык.

Название элемента указывается в начальном ярлыке (записывается <element-name>) и в заключительном ярлыке (записывается </element-name>); обратите внимание на косую черту перед названием элемента в заключительном ярлыке. Например, начальный и заключительный ярлыки элемента типа UL разграничивают пункты в списке:

<UL>

<LI><P>...list item 1...

<LI><P>...list item 2...

</UL>

Некоторые типы элементов в HTML позволяют авторам опускать заключительные ярлыки (например, P и LI типы элементов). Несколько типов элементов так-же позволяют опускать начальные ярлыки; например, HEAD и BODY. HTML DTD указывает для каждого типа элементов является ли начальный и заключительный ярлыки обязательными.

Некоторые типы HTML элементов не имеют содержания. Например, элемент переноса строки BR не имеет содержания; он служит лишь для того чтобы закончить строку текста. Подобные пустые (empty) элементы никогда не имеют заключительных ярлыков. Определение типа документа и текст спецификации указывают является ли элемент пустым (не имеет содержания) или, если он может обладать содержанием, то что является законным содержанием.

Имена элементов всегда нечуствительны к регистру.

За информацией о правилах управляющих элементами (например, элементы должны правильно вкладыватся друг в друга, заключительный ярлык закрывает все опущеные начальные ярлыки вплоть до соответствующего началеного ярлыка (см. раздел 7.5.1), и т.п.), обращайтесь к стандарту SGML.

Например, следующий абзац:

<P>Это первый абзац.</P>

...блочный элемент...

может быть переписан без своего заключительного ярлыка:

<P>Это первый абзац.

...блочный элемент...

так как начальный ярлык <P> закрывается последующим блочным элементом. Аналогично, если абзац заключается в блочном элементе, как в:

<DIV>

<P>Это абзац.

</DIV>

то заключительный ярлык обертывающего блочного элемента (в данном случае, </DIV>) подразумевает наличие заключительного ярлыка открытого начального ярлыка <P>.

Элементы не являются ярлыками. Некоторые люди называют элементы ярлыками (например "ярлык P"). Следует помнить, что элемент -- это одно, а ярлык (будь то начальный или залючительный ярлык) -- другое. В частности, элемент HEAD присутствует всегда, не смотря на то что как начальный так и конечный ярлыки HEAD могут отсутствовать в разметке.

Все типы элементов объявленые в настоящей спецификации перечислены в указателе элементов.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]