Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Ответы_по_ИТ.doc
Скачиваний:
51
Добавлен:
24.04.2019
Размер:
407.55 Кб
Скачать

3. Логическая и физическая структура документа. Разметка. Виды разметки.

Структура документа:

Логическая структура документа.

Логическая структура документа определяет его составные части и их отношение. Например, составными частями документа могут являться авторские данные, аннотация, оглавление, главы, разделы, параграфы рисунки сноски.

Физическая структура документа.

Физическая – макетная структура, которая содержит описание терминов физических единиц: страниц, полос, колонтитулов, рамок для рисунков и т.д. Моделирование определений выполняется с одним из двух стандартов: ISO 8613( ODA – Office Document Architecture) ; ISO 8879( SGML – Standart Generalized Markup language).

Разметка - дополнительная информация, включаемая в документ и выполняющая функции: выделение логических элементов документа и определение особенностей обработки выделенных элементов документа.

Виды разметки:

Командный подход заключается в использовании команд аналогичных командам размещения информации на печатающем устройстве. Пример: Escape – последовательности, использованные разработчиками Epson.

Описательная разметка заключается в использование меток (Tags), отмечающих начало и окончание элемента текста и способ интерпретации элемента, внешнее представление документа формируется процедурами обработки разметки и соответственно может изменяться в зависимости от реализации этих процедур. Развитие языков описательной разметки привело к их формализации, что позволяет автоматизировать обработку документов, использующих разметку, в первую очередь проверку и восстановление синтаксической корректности. Основным отличием описательной разметки является ориентированность на маркирование элементов документа не по критерию обработки (как отображать), а по критерию содержания (чем является). В результате по мере развития технологий элементы разметки начинают использоваться так, как не предполагалось ранее. На практике в современной системе разметки встречаются элементы и командной, и описательной разметки. Современные системы описательной разметки рассматривают документы как иерархические древовидные структуры, а также обеспечивают некоторые средства для встроенных перекрестных ссылок, поэтому такие документы рассматриваются, как слабо структурированные базы данных.

Вопрос 4. TeX. Разработчики. Наиболее известные варианты. Преимущества.

TEX

Система разработана Д. Кнутом.

Основные цели разработки:

1) Минимизация трудозатрат пользователя, создающего высококачественную печатную продукцию преимущественно научного направления;

2) Инвариантность (одинаковость) результатов использования системы на различных компьютерах.

Одним из основных преимуществ стала возможность включать в текст математические формулы путем использования символов форматирования, сходных с обозначением математических операций и функций, используемых в языках программирования.

Общий базовый вариант TEX включает приблизительно 300 команд. Вариант, разработанный Кнутом - PlanTex - добавляет около 600 команд. Довольно широко используется вариант, разработанный Лампортом – Latex.

AMS-TEX (American Mathematical Society)

Тех при обработке файла, соответствующего формата получает файл формата DVI. Фалы DVI могут напечатаны из средств просмотра интерактивной цифровой видео системы или преобразованных в файлы других общих форматов(PostScript, PDF). В большинстве областей научно технический читательской деятельности TEX стал стандартом.

5 билет. PostScript Был разработан в 1976 году Джоном Воноком. Целью разработки было совмещение достоинств матричной и векторной технологии внедрения информации.  Матричные печатающие устройства первоначально предназначались для вывода текстовой информации и стали альтернативой тИповым принтерам. тИповые принтеры использовали технологию печати печатных машин, то есть пользовались только фиксированным шрифтом; матричные принтеры формировали изображение каждого символа как совокупность точек, это позволяло печатать текст различными шрифтами, настраиваемыми или загружаемыми в принтер, в дальнейшем матричные принтеры стали обрабатывать специальные escape-последовательности, содержащие наборы точек, то есть предоставили возможность печати растровой графики.  Устройства вывода векторной графики (плоттеры или графопостроители) обрабатывали команды перемещения пишущего узла, что позволяло эффективно и качественно формировать чертежи. Достоинством векторной графики является то, что любое изображение, в том числе изображение символа шрифта, формируется путем рисования кривых, в результате чего изображение выглядит одинаково при любом масштабе и не проявляется лестничный эффект растрилизации.  PostScript представляет любые изображения в виде совокупности прямых и кубических прямых Безье (cubic Bezier Curves), позволяет их вращать, масштабировать, осуществлять другие преобразования и растрилизовать. Интерпретаторы PostScript документов, выполняющие их растеризацию для вывода на любое устройство называют RIP (Raster Image Processor). Интерпретатор может быть реализован аппаратно или программно. Документ на языке PostScript представляет программу, использующую графические операторы. Запись выражения осуществляется в польской нотации RPN (Reverse Polish Notation). PostScript может быть написан вручную, но как правило формируется программно.  Основные три способа использования PostScript документа при печати:  1) использование PostScript принтера, обрабатывающего непосредственно команды языка аппаратно;  2) использование аппаратного PostScript адаптера к не PostScript принтеру 3) Использование программного драйвера GhostScript, выполняющего аналогичную функцию. PDF – Portable Document Format. Был разработан в начале каких годов фирмой Adobe, владевшим на то время форматом PostScipt, формат PDF основан на использовании трех технологий  1) подмножество языка PostScipt  2) Система встраивания и замена шрифтом для обеспечения структурированная 3) система хранения.

Вопрос 6. SGML. Три составных части документа SGML. Три основных типа конструкций SGML. HTML. Назначение. Базовые элементы HTML. Тэги физической разметки. Тэги логической разметки. Тэги оформления таблиц.

SGMLstandard generalized markup language

Представляет собой метод создания структурированных документов и языков их разметки, в этом языке каждый документ имеет 3 части

  1. Декларации (объявления или определения) привязывающие к определенным значениям параметры обработки и имена синтаксиса

  2. Пролог состоит из декларации о типе документа, определяющих типы элементов документа, взаимосвязи между элементами и их атрибуты, а также условные обозначения, которые могут быть задействованы при разметке

  3. Данные - состоящие из разметки документа и собственно информации

Основные типы конструкции языка

Описание элементов <!ELEMENT …>

Описание объектов <!ENTITY …>

Описание атрибутов <!ATTLIST …>

Элемент – основная компонента документа

Объект – группа или род элементов

Атрибут – характеристика элемента

Декларации и пролог на языке SGML задают структуру документов и будучи отделены от размеченного текста, образуют описание типа документа DTDDocument Type Definition.

Тип документа объявляется в документе путем включения DTD фрагмента или ссылки на DTD файл.

Пример:

<!DOCTYPE type1 [ <!ENTITY greeting “helloworld”>]>

<!DOCTYPE html PUBLIC “- // W3C // DTD XHTML 1.0 Transitional // EN” “ http: //www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd”>

<!DOCTYPE people_list SYSTEM “example.dtt”>

Пример DTD описания:

<!ELEMENT people_list (person*) > - список элементов person

<!ELEMENT person (name, birthdate?, gender?, socialsecuritynumber?)> - совокупность имя… (с ? – не обязательно)

<!ELEMENT name (#PCDATA)> - строковые фрагменты

<!ELEMENT birthdate (#PCDATA)>

<!ELEMENT gender (#PCDATA)>

<!ELEMENT socialsecuritynumber (#PCDATA)>

HTML – HyperText Markup Language

Синтаксис описывается в DTD

Ориентирован на решение следующих задач:

  1. Описание структуры документа (заголовки, шрифты и …)

  2. Создание гипертекстовых ссылок и управление навигацией в глобальных и локальных сетях

  3. Реализация пользовательских интерфейсов

Базовые элементы HTML документы HEAD и BODY

BODY содержит всю информацию составляющую документ и называется контент, HEAD содержит только информацию о документе.

В HTML имеются следующие средства настройки отображения текстовой информации:

  1. Маркирование заголовков (Н1-6)

  2. Физическая разметка (I B U Strike BIG Small Sub Sup)

  3. Логическая EM Strong CODE SAMP VAR (имя переменной, в примерах, формулах) DFN (определение к какому либо термину, обычно жирный и курсив) CITE (цитата, обычный курсив)

  4. Теги оформления списков UL – маркированный, OL – нумерованный, DL – список определений, LI – элемент списка

  5. Теги оформления таблиц TABLE – объявление таблиц, thead – заголовок, tr – строка, td – ячейка, th – заголовочный элемент таблицы