Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ОТВЕТЫ.doc
Скачиваний:
98
Добавлен:
11.02.2015
Размер:
1.84 Mб
Скачать

Вопрос 2: Представление текстовой информации в компьютере (понятие текста, кодировка символов, восьмибитные кодировки символов, unicode, понятие электронного текста, гипертекст).

Для представления текста его символы кодируются двоичными числами.

При вводе в ПК каждая буква кодируется, а при выводе (на экран или печать) по этим числам строятся изображения букв.

Кодировка символов - однозначное соответствие между набором букв и набором чисел.

 Таблица символов ASCII

 Первоначально для представления печатных символов определили семиразрядные числа (состоящие из 7 двоичных цифр и занимающие в памяти 7 бит). Это давало 128 (два в седьмой степени = 128) чисел для кодирования символов американского английского: 27 строчных букв, 27 прописных, 10 цифр, знаки пунктуации и т.д.) Именно такой, 7-битной, является таблица символов ASCII (American standard code for information interchange).

Символы ASCIIявляются материалом дляASCII art.

Восьмибитные кодировки

В современных компьютерах минимально адресуемая единица памяти — 8-битный байт, поэтому там используются 8-битные кодировки символов.

8-битная ASCIIпозволяет закодировать 256 символов (два в восьмой степени). Каждый символ кодируется 8 битами (8-разрядным двоичным числом).

Windows 1251- 8-битная кодировка для операционных систем MS Windows.

Другие 8-разрядные кодировки: LATIN-1(OEM),ISO 8859-5, КОИ-8.

Было создано множество разных 8-битных кодировок в связи с расширением круга поддерживаемых языков. Возникли проблемы отображения документов в неправильной кодировке, ограниченности набора символов, преобразования одной кодировки в другую, дублирования шрифтов.

Было решено создать единую 16-битную кодировку для всех языков.

ЮНИКОД

UNICODE (UNIversal CODE) - стандарт 16-разрядного кодирования символов. В 16-разрядном UNICODE можно закодировать 65 536 символов.

Стандарт UNICODEпредложен в 1991 году некоммерческой организацией «Консорциум Юникода» (Unicode® Consortium, Unicode Inc.), объединяющей крупнейшие IT-корпорации.

UNICODEвключает практически все современные письменности, в том числе:

  • арабскую,

  • армянскую,

  • бенгальскую,

  • бирманскую,

  • греческую,

  • грузинскую,

  • деванагари,

  • иврит,

  • кириллицу,

  • коптскую,

  • кхмерскую,

  • латинскую,

  • тамильскую,

  • хангыль,

  • китайское письмо (Китай, Япония, Корея),

  • чероки,

  • эфиопскую,

  • японскую (катакана, хирагана, кандзи).

С академическими целями в UNICODEдобавлены многие исторические письменности, в том числе:

  • руны,

  • древнегреческая,

  • египетские иероглифы,

  • клинопись,

  • письменность майя,

  • этрусский алфавит.

В UNICODEпредставлен широкий набор пиктограмм, математических и музыкальных символов.

Электронный текст

 Всемиотике:ТЕКСТ(от лат.textus- ткань, соединение) - объединенная смысловой связью последовательность знаковых единиц любой формы коммуникаций (письмо, песня, танец, рисунок, обряд).

В языкознании:ТЕКСТ- объединенная смысловой связью последовательность вербальных единиц (устный и письменный).

В информатике: ТЕКСТ - форма представления данных в виде последовательности символов (букв, знаков пунктуации, специальных символов) выбранного языка, содержательно рассматриваемой как единое целое.

E-text 

Электронный текст - это текст, записанный в памяти компьютерной системы.На диски записываются документы, книги, журналы, справочники, словари... .

Электронные тексты сопровождаются программным обеспечением.

Электронные тексты, как правило, сопровождаются изображениями и звуком. Все шире используется мультисреда. Электронные книги нередко могут также читаться вслух компьютером. Так как электронные тексты располагаются в компьютерных системах, то перед читателями (пользователями) открываются новые возможности: можно проводить любой анализ текста, находить нужные строки, абзацы, разделы, сцены и т.д.

 Особое значение при компьютерном представлении, обработке, поиске информации имеет методология, именуемая гипертекстом.

 Гипертекст

 Гипертекст (hypertext) - текст, представленный в виде ассоциативно связанных блоков, переход между которыми осуществляется с помощью гиперссылок.  Гиперссылка - фрагмент текста (как правило отличающегося элементами форматирования: цвет, подчеркивание, курсив) или графика, выбор которого позволяет выполнить переход к другому фрагменту текста (файла, Web-странице). Гипертекст может быть расположен в различных частях компьютерной сети. Тогда взаимодействие компонентов определяется протоколом (соглашением). В сети Internet это гипертекстовый протокол передачи. HTTP (HyperText Transfer Protocol) - описывающий процедуры обмена блоками гипертекста. Создание гипертекстов осуществляется с помощью гипертекстового языка разметки документов. (HyperText Markup Language, HTML). Главной задачей HTML является осуществление пользователями гипертекстовой разметки обычных текстов .