Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ЛабИнф1-3

.pdf
Скачиваний:
117
Добавлен:
31.03.2015
Размер:
1.01 Mб
Скачать

11

торая на ее основе реализуется. Проявляются прагматические свойства информации только при наличии единства информации (объекта), пользователя и цели управления. Прагматический аспект рассмотрения связан с ценностью, полезностью использования информации при выработке потребителем решения для достижения своей цели. С этой точки зрения анализируются потребительские свойства информации. Эта форма адекватности непосредственно связана с практическим использованием.

Прагматическая мера информации определяет полезность информации (ценность) для достижения пользователем поставленной цели. Эта мера также величина относительная, обусловленная особенностями использования этой информации в той или иной системе.

Свойства информации

Возможность и эффективность использования информации обусловливаются основными ее потребительскими свойствами (показателями качества):

1.Репрезентативность информации связана с правильностью ее отбора и формирования в целях адекватного отражения свойств объекта. Важнейшее значение здесь имеют: правильность концепции, на базе которой сформулировано исходное понятие; обоснованность отбора существенных признаков и связей отображаемого явления.

Нарушение репрезентативности информации приводит нередко к существенным ее погрешностям.

2.Содержательность информации отражает семантическую емкость, равную отношению количества семантической информации в сообщении к объему обрабатываемых данных.

С увеличением содержательности информации растет семантическая пропускная способность информационной системы, так как для получения одних и тех же сведений требуется преобразовать меньший объем данных.

Наряду с коэффициентом содержательности, отражающим семантический аспект, можно использовать и коэффициент информативности, характеризующийся отношением количества синтаксической информации (по Шеннону) к объему данных.

3.Достаточность (полнота) информации означает, что она содержит минимальный, но достаточный для принятия правильного решения состав (набор показателей). Понятие полноты информации связано с ее смысловым содержанием (семантикой) и прагматикой. Как неполная, т.е. недостаточная для принятия правильного решения, так и избыточная информация снижает эффективность принимаемых пользователем решений.

4.Доступность информации восприятию пользователя обеспечивается выполнением соответствующих процедур ее получения и преобразования. Например, в информационной системе информация преобразовывается к доступной и удобной для восприятия пользователя форме. Это достигается, в частности, и путем согласования ее семантической формы с тезаурусом пользователя.

5.Актуальность информации определяется степенью сохранения ценности информации для управления в момент ее использования и зависит от дина-

12

мики изменения ее характеристик и от интервала времени, прошедшего с момента возникновения данной информации.

6.Своевременность информации означает ее поступление не позже заранее назначенного момента времени, согласованного со временем решения поставленной задачи.

7.Точность информации определяется степенью близости получаемой информации к реальному состоянию объекта, процесса, явления и т.п. Для информации, отображаемой цифровым кодом, известны четыре классификационных понятия точности: формальная точность, измеряемая значением единицы младшего разряда числа; реальная точность, определяемая значением единицы последнего разряда числа, верность которого гарантируется; максимальная точность, которую можно получить в конкретных условиях функционирования системы; необходимая точность, определяемая функциональным назначением показателя.

8.Достоверность информации определяется ее свойством отражать реально существующие объекты с необходимой точностью. Измеряется достоверность информации доверительной вероятностью необходимой точности, т.е. вероятностью того, что отображаемое информацией значение параметра отличается от истинного значения этого параметра в пределах необходимой точности.

9.Устойчивость информации отражает ее способность реагировать на изменения исходных данных без нарушения необходимой точности. Устойчивость информации, как и репрезентативность, обусловлена выбранной методикой ее отбора и формирования.

Измерение информации

Применяются два подхода к измерению информации: алфавитный (т.е. количество информации зависит от последовательности знаков); содержательный или вероятностный (т.е. количество информации зависит от ее содержания).

В содержательном подходе возможна качественная оценка информации: новая, срочная, важная и т.д. Согласно Шеннону, информативность сообщения характеризуется содержащейся в нем полезной информацией - той частью сообщения, которая снимает полностью или уменьшает неопределенность какойлибо ситуации. Неопределенность некоторого события - это количество возможных исходов данного события. Так, например, неопределенность погоды на завтра обычно заключается в диапазоне температуры воздуха и возможности выпадения осадков.

Содержательный подход часто называют субъективным, так как разные люди (субъекты) информацию об одном и том же предмете оценивают поразному. Но если число исходов не зависит от суждений людей (случай бросания кубика или монеты), то информация о наступлении одного из возможных исходов является объективной.

13

Алфавитный (объемный) подход применяется в технике, где информацией считается любая хранящаяся, обрабатываемая или передаваемая последовательность знаков, сигналов.

Этот подход основан на подсчете числа символов в сообщении, то есть связан только с длиной сообщения и не учитывает его содержания. Но длина сообщения зависит не только от содержащейся в нем информации. На нее влияет мощность алфавита используемого языка.

Определение 1. Множество используемых в тексте символов называется алфавитом.

Определение 2. Полное количество символов алфавита называется мощностью алфавита.

Чем меньше знаков в используемом алфавите, тем длиннее сообщение. Так, например, в алфавите азбуки Морзе всего три знака (точка, тире, пауза), поэтому для кодирования каждой русской или латинской буквы нужно использовать несколько знаков, и текст, закодированный по Морзе, будет намного длиннее, чем при обычной записи.

В вычислительной технике наименьшей единицей измерения информации является 1 бит (binary digit). Один бит соответствует одному знаку двоичного алфавита, т.е. 0 или 1.

Таким образом, 1бит = 0 или 1.

Для удобства помимо бита применяются более крупные единицы измерения информации.

1байт = 8 бит Байт - это восьмиразрядный двоичный код, с помощью которого можно

представить один символ. При вводе в ЭВМ символа с клавиатуры машине передается 1 байт информации.

1Кб (килобайт) = 1024 байт

1Мб (мегабайт) = 1024 Кб

1Гб (гигабайт) = 1024 Мб

1Тб(терабайт)=1024 Гб.

Для того чтобы подсчитать количество информации в сообщении необходимо умножить количество информации, которое несет 1 символ, на количество символов.

Определение 3. Информационный объем сообщения (информационная емкость сообщения) - количество информации в сообщении, измеренное в битах, байтах или производных единицах (Кбайтах, Мбайтах и т.д.).

Американский инженер Р. Хартли в 1928 г. процесс получения информации рассматривал как выбор одного сообщения из конечного наперѐд заданного множества из N равновероятных сообщений, а количество информации I, содер-

14

жащееся в выбранном сообщении, определял как двоичный логарифм N. Форму-

ла Хартли: I log

2

N .

 

 

Информационная емкость одного символа обычно обозначается через I, мощность алфавита - N. Эти величины связаны между собой следующей формулой: 2I=N, т.е. информационная емкость 1 символа I=log2N.

Американский учѐный Клод Шеннон предложил в 1948 г. другую формулу определения количества информации, учитывающую возможную неодинаковую вероятность сообщений в наборе. Формула Шеннона:

I = - ( p1log2 p1 + p2 log2 p2 + . . . + pN log2 pN) или

N

 

1

 

I

pi log2

, где pi — вероятность того, что именно i-е сообщение вы-

 

i 1

 

pi

делено в наборе из N сообщений.

Легко заметить, что если вероятности p1, ..., pN равны, то каждая из них равна 1/N, и формула Шеннона превращается в формулу Хартли.

В качестве единицы информации Клод Шеннон предложил принять один бит (англ. bit binary digit — двоичная цифра).

Кодирование данных

Наиболее распространенным является код ASCII (American Standard Code for Information Interchange), который используется для внутреннего представления символьной информации в операционной системе MS DOS, в Блокноте операционной системы Windows’xx, а также для кодирования текстовых файлов в Интернет. Структура кода представлена в таблице (обозначения столбцов и строк выделены полужирно).

Таблица кодов (приложение 2) содержит 16 столбцов и 16 строк; каждая строка и столбец пронумерованы в шестнадцатеричной системе счисления цифрами от 0 до F. Шестнадцатеричное представление ASCII-кода складывается из номера столбца и номера строки, в которых располагается символ. Так, например, ASCII-код символа 1 есть число 3116, что по правилам перевода означает 1100012. В двоичной системе код представляется восемью разрядами, т.е. двоичный ASCII-код символа 1 есть 001100012.

Данная таблица делится на две части: столбцы с номерами от 0 до 7 составляют стандарт кода – неизменяемую часть; столбцы с номерами от 8 до F являются расширением кода и используются, в частности, для кодирования символов национальных алфавитов. В столбцах с номерами 0 и 1 находятся управляющие символы, которые используются, в частности, для управления принтером. Столбцы с номерами от 2 до 7 содержат знаки препинания, арифметических действий, некоторые служебные символы, а также заглавные и строч-

15

ные буквы латинского алфавита. Расширение кода включает символы псевдографики, буквы национальных алфавитов и другие символы.

Вприведенной таблице в качестве национального выбран русский алфавит. Пустые ячейки означают, что они не используются, а ячейки с многоточием содержат символы, которые умышленно не показаны.

Кроме кодировки ASCII существуют и другие системы кодирования: Windows 1251, КОИ-8 и др. Все вышеназванные системы кодирования используют для кодирования 1 символа - 8 бит или 1байт.

В1991 году была предложена 16-битная система Unicode (Юникод). Для представления каждого символа в этой системе используются 2 байта: один байт для кодирования символа, другой для кодирования признака. Тем самым обеспечивается информационная совместимость данного способа кодирования со стандартом ASCII.

Примеры решения задач Пример 1. Сообщение, записанное буквами 64-символьного алфавита, со-

держит 20 символов. Какой объем информации оно несет?

Решение:

Применим формулу Хартли I log

2

N

log

2

64 6 . Один символ алфа-

 

 

 

 

вита несет в себе 6 бит информации, соответственно сообщение из 20 символов несет 6 · 20 = 120 бит.

Пример 2. Жители планеты Принтер используют алфавит из 256 знаков, а жители планеты Плоттер — из 128 знаков. Для жителей какой планеты сообщение из 10 знаков несет больше информации и на сколько?

 

Решение:

 

 

 

 

 

Один

символ

алфавита

жителей планеты Принтер несет в себе

I

log

2

N

log

2

256

8 бит

информации, а жителей планеты Плоттер –

 

 

 

 

 

 

 

I

log

2

N

log

2

128

7 бит информации.

 

 

 

 

 

 

 

Соответственно сообщение из 10 знаков для жителей Принтер несет 10 · 8 = 80 бит, а для жителей Плоттер — 10 · 7 = 70 бит

80– 70 = 10 бит.

Ответ: Больше для жителей Принтер на 10 бит.

Пример 3. Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего высказывания Жан-Жака Руссо: Тысячи путей ведут к заблуждению, к истине - только один.

16

Решение.

Определим количество символов, включая пробелы и знаки препинания – 57. Так как каждый символ кодируется одним байтом, то информационный объем равен 57·1 байт = 57 байт=57·8 бит = 456 бит.

Пример 4. С помощью таблицы ASCII-кодов закодировать сообщение "группа", используя шестнадцатеричное представление кода.

Решение: A3 E0 E3 AF AF A0 (для простоты коды символов разделены пробелами)

Пример 5. Дешифруйте текст 49 6E 66 6F 72 6D 61 74 69 6F 6E, используя таблицу ASCII-кодов.

Решение. information.

Пример 6. В кодировке Unicode на каждый символ отводится 2 байта. Определите информационный объем слова из двадцати четырех символов в этой кодировке.

Решение. Объем равен 24 2байта = 48 байт = 48 8 бит = 384 бита Ответ: 384 бита

Пример 7. Какое минимальное количество двоичных разрядов потребуется для того, чтобы закодировать алфавит языка племени Мумба-Юмба, состоящий их 16 символов?

Решение: 2i = 16 ; 2i = 24 ; i = 4

Ответ: 4 разряда

Пример 8. Определить информационный объем полноэкранного графиче-

ского изображения на экране, имеющем разрешающую способность 640

320 и

16 возможных цветов.

 

Решение:

 

i = log 2 16 = 4 (количество бит, необходимых для кодирования цвета)

640 320 4 = 819200 бит = 102400 байт = 100 Кбайт

 

Ответ: 100 Кбайт

 

Пример 9. Для хранения области экрана монитора размером 256

128 то-

чек выделено 32 Кбайта оперативной памяти. Сколько максимально цветов допустимо использовать для раскраски точек?

Решение: 256 128 = 32768 бит 32 Кбайт = 32 1024 байт = 32768 байт =

32768 8 бит.

17

Для цвета остается 8 бит 28 = 256 (количество цветов)

Ответ: 256 цветов

Пример 10. Какое количество информации содержится в слове «информатика» (каждый символ кодировать 1 байтом).

Решение. В слове «информатика» 11 символов, поэтому количество информации определяется как 11* 1байт = 11 байт.

Пример 11. Объем информационного сообщения 12 288 битов (учитывая, что 1 байт = 8 битов), можно выразить как:

Решение. Так как в в 1 байте - 8 бит, то 12 288 бит = 12 288/8=1536 байт. 1536/1024 = 1,5Кбайт.

Пример 12. Измерить информационную емкость 1 символа русского алфавита (букву ѐ не yчитывать).

Решение. Если не учитывать ѐ, то в русском алфавите 32 буквы. Соответственно, I=log2 32=5 бит, т.е. каждый символ в русском алфавите несет 5 бит информации.

Пример 13. Мощность некоторого алфавита равна 64 символам. Каким будет объем информации в тексте, состоящем из 100 символов

Решение. Найдем информационную емкость 1 символа, используя формулу 2I=N: 2I=64, формула Хартли: I= log2 64=6 (бит). Объем информации в тексте будет равен 100 6 бит = 600 бит.

Пример 14. Какое количество символов содержится в алфавите, при помощи которого напечатана газета из 20 страниц, на каждой из которых содержится 15 строк по 20 символов, если вся газета занимает 5,86 Кб памяти компьютера.

Решение: Количество символов на одной странице:

15 20 = 300 (символов).

Всего символов в книге n = 300 20 = 6000 (символов). Общее количество информации в битах I i n , где i – бит в 1 символе , n – количество символов.

5,86 Кб = 48005,12 (бит)

Определим сколько бит в 1 символе:

i

I

 

48005,2 бит

8 бит

 

 

 

 

n

 

6000 символов

 

 

 

2i N , где N – мощность алфавита, значит 28 N , N=256 символов в алфавите

18

Пример 15. Какое количество символов содержится на странице энциклопедического словаря, если в памяти компьютера эта страница занимает 13 Кб?

Решение: По умолчанию количество бит информации, приходящейся на один символ, равно 8 бит. Переведем 13 Кб в биты:

13 Кб 1024 байт 8 бит = 106496 бит.

Количество символов можно найти по формуле: n Ii ,

где n – количество символов, I-количество информации, I – количество бит информации, приходящееся на один символ.

n

106496бит

13310символов .

 

 

8 бит

 

 

5. Самостоятельная работа студентов на занятии Оформить отчет по лабораторной работе.

Задание 1. Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего высказывания:

1.А вы друзья как ни садитесь, все в музыканты не годитесь.

2.А ларчик просто открывался.

3.Аз, буки и веди страшат как медведи.

4.Азбука — к мудрости ступенька.

5.Азбука — наука, а ребятам — бука.

6.Аппетит приходит во время еды.

7.Без труда не вытащишь рыбку из пруда.

8.Большому кораблю — большое плаванье.

9.Бывает, что усердие превозмогает и рассудок.

10.В огороде бузина, а в Киеве — дядька. 11.В одно ухо вошло, в другое вышло. 12.В открытую дверь не ломятся.

13.В чужой монастырь со своим уставом не ходят.

14.В чужом глазу сучок видим, а в своем бревна не замечаем. 15.Взялся за гуж — не говори, что не дюж.

16.Волков бояться — в лес не ходить. 17.Всяк правду ищет, да не всяк ее творит. 18.Где родился, там и пригодился.

19

Задание 2.

1.Сколько килобайт будет содержаться в книге из 10 страниц при использовании 32 символьного алфавита, если на одной странице умещается 50 строк по 50 символов

2.Сколько килобайт будет содержаться в книге из 15 страниц при использовании 16 символьного алфавита, если на одной странице умещается 15 строк по 47 символов

3.Сколько килобайт будет содержаться в книге из 250 страниц при использовании 128 символьного алфавита, если на одной странице умещается 50 строк по 80 символов

4.Сколько килобайт будет содержаться в книге из 250 страниц при использовании 128 символьного алфавита, если на одной странице умещается 35 строк по 40 символов

5.Сколько килобайт будет содержаться в книге из 176 страниц при использовании 256 символьного алфавита, если на одной странице умещается 40 строк по 60 символов

6.Сколько килобайт будет содержаться в книге из 175 страниц при использовании 256 символьного алфавита, если на одной странице умещается 44 строк по 55 символов

7.Сколько килобайт будет содержаться в книге из 120 страниц при использовании 128 символьного алфавита, если на одной странице умещается 50 строк по 60 символов

8.Сколько килобайт будет содержаться в книге из 78 страниц при использовании 128 символьного алфавита, если на одной странице умещается 40 строк по 66 символов

9.Какое количество символов содержится в алфавите, при помощи которого напечатана газета из 20 страниц, на каждой из которых содержится 65 строк по 40 символов, если вся газета занимает 5,86 Кб памяти компьютера.

10.Какое количество символов содержится в алфавите, при помощи которого напечатана газета из 10 страниц, на каждой из которых содержится 90 строк по 85 символов, если вся газета занимает 75 Кб памяти компьютера.

11.Какое количество символов содержится в алфавите, при помощи которого напечатана газета из 40 страниц, на каждой из которых содержится 90 строк по 75 символов, если вся газета занимает 75 Кб памяти компьютера.

12.Какое количество символов содержится в алфавите, при помощи которого напечатана газета из 35 страниц, на каждой из которых содержится 150 строк по 80 символов, если вся газета занимает 512 Кб памяти компьютера.

20

13.Какое количество символов содержится в алфавите, при помощи которого напечатана газета из 40 страниц, на каждой из которых содержится 200 строк по 100 символов, если вся газета занимает 920 Кб памяти компьютера.

14.Какое количество символов содержится в алфавите, при помощи которого напечатана газета из 25 страниц, на каждой из которых содержится 200 строк по 90 символов, если вся газета занимает 700 Кб памяти компьютера.

15.Какое количество символов содержится в алфавите, при помощи которого напечатана газета из 32 страниц, на каждой из которых содержится 150 строк по 120 символов, если вся газета занимает 750 Кб памяти компьютера.

16.Какое количество символов содержится в алфавите, при помощи которого напечатана газета из 16 страниц, на каждой из которых содержится 130 строк по 100 символов, если вся газета занимает 700 Кб памяти компьютера.

17.Какое количество символов содержится в алфавите, при помощи которого напечатана газета из 24 страниц, на каждой из которых содержится 100 строк по 120 символов, если вся газета занимает 512 Кб памяти компьютера.

Задание 3.

1.Сколько символов содержится на газетной странице, если в памяти компьютера эта страница занимает 150 Кб.

2.Сколько символов содержится на газетной странице, если в памяти компьютера эта страница занимает 200 Кб.

3.Сколько символов содержится на газетной странице, если в памяти компьютера эта страница занимает 125 Кб.

4.Сколько символов содержится на газетной странице, если в памяти компьютера эта страница занимает 250 Кб.

5.Сколько символов содержится на газетной странице, если в памяти компьютера эта страница занимает 100 Кб.

6.Сколько символов содержится на газетной странице, если в памяти компьютера эта страница занимает 200 Кб.

7.Сколько символов содержится на газетной странице, если в памяти компьютера эта страница занимает 1,5 Кб.

8.Сколько символов содержится на газетной странице, если в памяти компьютера эта страница занимает 100 Кб.

9.Сколько символов содержится на газетной странице, если в памяти компьютера эта страница занимает 2 Кб.

10.Сообщение, записанное буквами из 16 символьного алфавита, содержит в себе 10 символов. Какой объем информации в битах оно несет?