Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Информатика / Теория / мет_указ_КР_ОМИ_КОСОМИ

.pdf
Скачиваний:
18
Добавлен:
13.02.2015
Размер:
2.03 Mб
Скачать

 

11

 

 

 

 

Вариант 8

80 .

44

Вариант 9

11 .

23

Вариант 10

49 .

72

 

 

 

 

 

 

 

 

Задание 5

 

 

 

 

 

 

 

 

 

 

 

 

 

Номер вариан-

 

Перевести числа из восьмеричной и шестнадцате-

 

 

ричной системы счисления в двоичную

 

та

 

 

 

 

Восьмеричное число

Шестнадцатеричное число

 

 

Вариант 1

 

1

3

7

.

0

3

1

0

C

1 .

6

7

 

D

Вариант 2

 

3

4

4

.

5

3

3

0

C

E .

B

1

 

E

Вариант 3

 

0

7

3

.

6

7

2

8

7

5 .

B

5

 

3

Вариант 4

 

5

2

3

.

6

3

6

7

1

A .

F

9

 

0

Вариант 5

 

7

6

4

.

2

1

1

F

8

2 .

2

4

 

C

Вариант 6

 

2

0

5

.

5

2

0

D

2

8 .

8

F

2

Вариант 7

 

3

3

3

.

6

0

6

6

4

D .

2

0

 

A

Вариант 8

 

1

7

2

.

4

0

5

3

F

3 .

E

0

 

C

Вариант 9

 

4

6

4

.

3

1

3

D

7

3 .

0

C

5

Вариант 10

 

6

2

1

.

7

4

3

C

2

1 .

5

D

D

 

 

 

 

 

 

 

 

Задание 6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Перевести числа из двоичной сис-

 

 

 

 

Номер варианта

темы счисления в восьмеричную

 

 

 

 

 

 

 

 

 

 

систему счисления

 

 

 

 

 

Вариант 1

 

 

0111011000110.00001110100

 

 

 

 

 

Вариант 2

 

 

00001010111000.000000000000

 

 

 

 

 

Вариант 3

 

 

00000101111000.111100100000

 

 

 

 

 

Вариант 4

 

 

0100001011000.011101111000

 

 

 

 

 

Вариант 5

 

 

000010110001011.110001010000

 

 

 

 

Вариант 6

 

 

000000011011101.11111001100

 

 

 

 

 

Вариант 7

 

 

0000100110000.0101101110

 

 

 

 

 

 

Вариант 8

 

 

000101110000001.0011011100

 

 

 

 

 

Вариант 9

 

 

0110001000000.001111111000

 

 

 

 

 

Вариант 10

 

 

0110001010001.001010111000

 

 

 

 

 

 

 

 

 

 

Номер вари-

 

Перевести числа из двоичной системы счис-

 

 

ления в шестнадцатеричную систему счисле-

 

 

анта

 

 

 

 

 

 

 

 

 

ния

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Вариант 1

0000001100111110101.0001001110000

 

 

 

 

Вариант 2

00110011100111111.0110110010110

 

 

 

 

 

Вариант 3

000011011100101011.0101000110010

 

 

 

 

 

Вариант 4

0000011001000110101.0001110000000

 

 

 

 

Вариант 5

0000001100001011110.00101010001000

 

 

 

 

Вариант 6

01111110110001110.101011101001000

 

 

 

 

Вариант 7

000010010101101110.11100100010000

 

 

 

 

Вариант 8

001001100111001100.101001010011000

 

 

 

 

 

12

 

 

Вариант 9

000100011110100111.01000000100100

Вариант 10

000101110001001101.0110001110100

 

 

 

Задание 7

 

 

 

 

 

 

 

 

 

 

 

 

Перевести числа из

 

 

 

 

восьмеричной системы

 

 

Номер варианта

 

счисления в шестна-

 

 

 

 

дцатеричную (через

 

 

 

 

 

 

двоичную)

 

 

 

 

 

Восьмеричное число

 

Вариант 1

 

2

3

2 .

4

2

4

 

Вариант 2

 

7

6

7 .

5

0

0

 

Вариант 3

 

2

6

3 .

1

0

0

 

Вариант 4

 

1

2

5 .

3

2

3

 

Вариант 5

 

4

1

1 .

4

1

5

 

Вариант 6

 

4

6

2 .

4

5

6

 

Вариант 7

 

5

0

5 .

1

0

5

 

Вариант 8

 

2

6

1 .

5

4

5

 

Вариант 9

 

3

3

0 .

1

2

4

 

Вариант 10

 

1

4

6 .

7

1

2

 

 

 

 

 

 

Перевести числа из шест-

 

Номер варианта

 

надцатеричной системы

 

счисления в восьмеричную

 

 

 

 

 

(через двоичную)

 

 

Шестнадцатеричное число

 

Вариант 1

 

D

D

F .

0

E

C

 

Вариант 2

3

3

9 .

1

B

D

 

Вариант 3

4

F

7 .

D

B

F

 

Вариант 4

4

9

8 .

2

A

C

 

Вариант 5

1

1

C .

4

F

B

 

Вариант 6

 

F

6

C .

F

2

3

 

 

Вариант 7

3

0

8 .

6

E

D

 

Вариант 8

 

B

E

F .

7

4

D

 

Вариант 9

 

E

E

6 .

B

2

D

 

Вариант 10

9

0

1 .

0

8

B

Раздел № 2

"Количество информации"

Определить понятие «количество информации» довольно сложно. В решении этой проблемы существуют два основных подхода. Исторически они возникли почти одновременно. В конце 40-х годов XX века один из основоположников кибернетики американский математик Клод Шеннон развил вероятностный подход к измерению количества информации, а работы по созданию ЭВМ привели к «объемному» подходу.

13

Вероятностный подход

Рассмотрим в качестве примера опыт, связанный с бросанием правильной игральной кости, имеющей N граней. Результаты данного опыта могут быть следующие: выпадение грани с одним из следующих знаков: 1, 2, . . . N.

Введем в рассмотрение численную величину, измеряющую неопределенность — энтропию (обозначим ее H). Согласно развитой теории, в случае равновероятного выпадания каждой из граней величины N и H связаны меж-

ду собой формулой Хартли H = log2 N.

Важным при введении какой-либо величины является вопрос о том, что принимать за единицу ее измерения. Очевидно, H будет равно единице при N = 2. Иначе говоря, в качестве единицы принимается количество информации, связанное с проведением опыта, состоящего в получении одного из двух равновероятных исходов (примером такого опыта может служить бросание монеты при котором возможны два исхода: «орел», «решка»). Такая единица количества информации называется «бит».

В случае, когда вероятности Pi результатов опыта (в примере, приведенном выше — бросания игральной кости) неодинаковы, имеет место фор-

 

N

 

 

H Pi *log2 Pi

 

мула Шеннона

i 1

. В случае равновероятности событий

Pi N1 , и формула Шеннона переходит в формулу Хартли.

В качестве примера определим количество информации, связанное с появлением каждого символа в сообщениях, записанных на русском языке. Будем считать, что русский алфавит состоит из 33 букв и знака «пробел» для разделения слов. По формуле Хартли H = log2 34 5.09 бит.

Однако, в словах русского языка (равно как и в словах других языков) различные буквы встречаются неодинаково часто. Ниже приведена табл. 3 вероятностей частоты употребления различных знаков русского алфавита, полученная на основе анализа очень больших по объему текстов.

Воспользуемся для подсчета H формулой Шеннона: H 4.72 бит. Полученное значение H, как и можно было предположить, меньше вычисленного ранее. Величина H, вычисляемая по формуле Хартли, является максимальным количеством информации, которое могло бы приходиться на один знак.

Аналогичные подсчеты H можно провести и для других языков, например, использующих латинский алфавит — английского, немецкого, французского и др. (26 различных букв и «пробел»). По формуле Хартли по-

лучим H = log2 27 4.76 бит.

Таблица 1 Частотность букв русского языка

i

Символ

P(i)

i

Символ

P(i)

i

Символ

P(i)

 

 

 

 

 

 

 

 

 

1

пробел

0.175

12

Л

0.035

23

Б

0.014

2

О

0.090

13

К

0.028

24

Г

0.012

3

Е

0.072

14

М

0.026

25

Ч

0.012

14

4

Ё

0.072

15

Д

0.025

26

Й

0.010

5

А

0.062

16

П

0.023

27

Х

0.009

6

И

0.062

17

У

0.021

28

Ж

0.007

7

T

0.053

18

Я

0.018

29

Ю

0.006

8

H

0.053

19

Ы

0.016

30

Ш

0.006

9

C

0.045

20

З

0.016

31

Ц

0.004

10

P

0.040

21

Ь

0.014

32

Щ

0.003

11

B

0.038

22

Ъ

0.014

33

Э

0.003

 

 

 

 

 

 

34

Ф

0.002

Рассмотрим алфавит, состоящий из двух знаков 0 и 1. Если считать, что со знаками 0 и 1 в двоичном алфавите связаны одинаковые вероятности их появления (P(0)=P(1)= 0.5), то количество информации на один знак при двоичном кодировании будет равно H = log2 2 = 1 бит.

Таким образом, количество информации (в битах), заключенное в двоичном слове, равно числу двоичных знаков в нем.

Существуют дополнительные единицы информации диты (или хартли) и наты. Формулы расчета для русского алфавита:

H = log10 34 1.53 дит (хартли). H = ln 34 3.53 нат.

Объемный подход

В двоичной системе счисления знаки 0 и 1 называют битами (от английского выражения Binary digiTs двоичные цифры). В компьютере бит является наименьшей возможной единицей информации. Объем информации, записанной двоичными знаками в памяти компьютера или на внешнем носителе информации, подсчитывается просто по количеству требуемых для такой записи двоичных символов. При этом, в частности, невозможно нецелое число битов (в отличие от вероятностного подхода).

Для удобства использования введены и более крупные, чем бит, единицы количества информации. Так, двоичное слово из восьми знаков содержит один байт информации. 1024 байта образуют килобайт (Кбайт), 1024 килобайта мегабайт (Мбайт), 1024 мегабайта гигабайт (Гбайт), а 1024 гигабайта терабайт (Тбайт).

Между вероятностным и объемным количеством информации соотношение неоднозначное. Далеко не всякий текст, записанный двоичными символами, допускает измерение объема информации в вероятностном (кибернетическом) смысле, но заведомо допускает его в объемном. Далее, если некоторое сообщение допускают измеримость количества информации в обоих смыслах, то это количество не обязательно совпадает, при этом кибернетическое количество информации не может быть больше объемного.

В прикладной информатике практически всегда количество информации понимается в объемном смысле.

Как ни важно измерение информации, нельзя сводить к нему все связанные с этим понятием проблемы. При анализе информации социального (в

15

широким смысле) происхождения на первый план могут выступить такие ее свойства как истинность, своевременность, ценность, полнота и т.д. Их невозможно оценить в терминах «уменьшение неопределенности» (вероятностный подход) или числа символов (объемный подход). Обращение к качественной стороне информации породило иные подходы к ее оценке. При аксиологическом подходе стремятся исходить из ценности, практической значимости информации, т.е. качественных характеристик, значимых в социальной системе. При семантическом подходе информация рассматривается как с точки зрения формы, так и содержания. При этом информацию связывают с тезаурусом, т.е. полнотой систематизированного набора данных о предмете информации.

Задание 1 (объемный подход)

 

Перевести гигабайты в ме-

Перевести биты в

Номер варианта

байты, килобайты,

габайты, килобайты, байты

 

мегабайты и гига-

 

и биты

 

байты

 

 

 

 

 

Вариант 1

18 Гб

120259084288 бит

Вариант 2

22 Гб

094489280512 бит

Вариант 3

12 Гб

025769803776 бит

Вариант 4

46 Гб

103079215104 бит

Вариант 5

51 Гб

146028888064 бит

Вариант 6

35 Гб

206158430208 бит

Вариант 7

40 Гб

214748364800 бит

Вариант 8

56 Гб

111669149696 бит

Вариант 9

21 Гб

206158430208 бит

Вариант 10

32 Гб

060129542144 бит

 

Задание 2 (вероятностный подход)

 

 

 

 

 

Подсчитать количество информации (в битах,

Номер варианта

 

дитах и натах) по формуле Хартли и формуле

 

 

Шеннона в текстовом сообщении

Вариант 1

 

ОН ЛЮБИЛ СМОТРЕТЬ В НЕБО, ОНА - В МОНИТОР,

 

 

 

Вариант 2

 

В РАЗНОЦВЕТНЫЕ БАННЕРЫ, ЧАТОВ УЗОР,

 

 

 

Вариант 3

 

В ИНТЕРНЕТА ПОПАВ ПАУТИНУ...

Вариант 4

 

ОН ПРИВЫК НАБЛЮДАТЬ ЕЕ СПИНУ...

Вариант 5

 

В ОДИНОЧЕСТВЕ ЕЛ, ОДИНОКО ЧИТАЛ,

Вариант 6

 

А ЕЕ МОНИТОР ПОСТОЯННО МЕРЦАЛ...

Вариант 7

 

И КОГДА ПОДХОДИЛ К НЕЙ ПОБЛИЖЕ,

Вариант 8

 

ОНА ВСЯ НАПРЯГАЛАСЬ: "НЕЛЬЗЯ ЛИ ПОТИШЕ!?

Вариант 9

 

НЕ ЛЮБЛЮ, КОГДА КТО-ТО СТОИТ ЗА СПИНОЙ!

Вариант 10

 

Я УСТАЛА... МНЕ МОЖНО ОСТАТЬСЯ ОДНОЙ?!"

16

ОН ЛЮБИЛ И ЖАЛЕЛ ЕЕ ТЁПЛЫЕ ПЛЕЧИ,

ВСПОМИНАЛ РАЗГОВОРЫ, СВИДАНИЯ, ВСТРЕЧИ...

ИОДНАЖДЫ ПОДУМАЛ, СЛЫША КЛАВИШЕЙ СТУК: «ИНТЕРЕСНО, ЧТО ТАМ?» И... КУПИЛ НОУТБУК...

ИТЕПЕРЬ КАЖДЫЙ ВЕЧЕР ОГНИ МОНИТОРОВ ЗАМЕНЯЮТ ИМ НЕЖНОСТЬ И СМЕХ РАЗГОВОРОВ...

КАЖДЫЙ ИЩЕТ ДРУГ ДРУГА В ПРИДУМАННОМ МИРЕ, В ДВУХ ЭКРАНАХ КОМПЬЮТЕРНЫХ В ТЕСНОЙ КВАРТИРЕ...

ИВ НОЧНОЙ ТИШИНЕ ИЗ-ЗА СПУЩЕННЫХ ШТОР

РЯДОМ ТУСКЛО МЕРЦАЕТ... ВТОРОЙ МОНИТОР...

Для расчета целесообразно использовать MS Excel 2007. Пример расчета приведен для фразы-определения "Данные это зарегистрированные сигналы".

Порядок выполнения расчетов количества информации в MS Excel 2007:

1.Запустить Мiсrоsоft Ехсеl 2007.

2.Создать чистую рабочую книгу и присвоить ей название "Количество информации".

3.Листу рабочей книги присвоить название "Расчет".

4.Подсчитать количество информации (энтропию) по формуле Хартли (в битах, натах и хартли (дитах)) и формуле Шеннона в текстовом сообщении "Данные - это зарегистрированные сигналы".

5.Основные формулы для расчета:

N

 

 

 

 

 

 

N

 

 

 

 

H Pi

log2

1

 

Pi log2 Pi

формула Шеннона

 

 

(1)

i 19

 

 

 

 

 

 

i 19

 

 

 

 

 

Pi

 

 

 

 

 

 

 

H log

 

N log

 

1

формула Хартли

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

2

 

N

 

 

 

(2)

N

 

 

 

 

 

 

 

 

 

 

 

 

 

Pi 1

 

 

 

 

 

 

 

 

 

 

 

(3)

i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

в битах

 

 

 

 

 

 

в натах

в хартли (дитах)

 

H log2 N

 

 

 

 

 

 

H ln N

H log10 N

6.Длина сообщения "Данные это зарегистрированные сигналы" составляет

39символов. N (алфавит сообщения) равен 17 символам ("д", "а", "н", "ы", "е", "-", "пробел", "э", "т", "о", "з", "р", "г", "и", "с", "в", "л").

7.На листе создать таблицу для расчета. Вставить в таблицу заголовки столбцов. Для объединения ячеек необходимо выделить ячейки, вызвать контекстное меню правой кнопкой мыши (команда "Формат ячеек"), выбрать в диалоговом окне вкладку "Выравнивание" и включить отображение "Объединение ячеек". Нумерацию символов произвести с помощью автозаполне-

17

ния по арифметической прогрессии (на ленте вкладка "Главная", диалоговое окно "Редактирование", кнопка "Заполнить", опция "Прогрессия", шаг 1, прогрессия "Арифметическая", заполнение по столбцам)

8. В столбец "Символ" вставить символы алфавита сообщения.

 

 

Данные - это зарегистрированные сигналы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Символ

Частота

Pi

log2(1/Pi)

Pi*log2(1/Pi)

log2(Pi)

Pi*log2(Pi)

1

д

 

 

 

 

 

 

2

а

 

 

 

 

 

 

3

н

 

 

 

 

 

 

4

ы

 

 

 

 

 

 

5

е

 

 

 

 

 

 

6

-

 

 

 

 

 

 

7

пробел

 

 

 

 

 

 

8

э

 

 

 

 

 

 

9

т

 

 

 

 

 

 

10

о

 

 

 

 

 

 

11

з

 

 

 

 

 

 

12

р

 

 

 

 

 

 

13

г

 

 

 

 

 

 

14

и

 

 

 

 

 

 

15

с

 

 

 

 

 

 

16

в

 

 

 

 

 

 

17

л

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Сумма

9. Подсчитать частоту для каждого символа сообщения (например, буква "д" встречается в сообщении 1 раз, буква "а" - 4 раза и т.д.). Результаты внести в столбец "Частота".

10.Рассчитать вероятность появления каждого символа. заполнив столбец Pi, по формуле:

вероятность

частота

 

длина сообщения

Для этого необходимо выполнить следующие действия:

Установить курсор в строку формул и набрать с клавиатуры знак "=".

Щелкнуть на ячейку с частотой появления символа и разделить результат на длину сообщения, использовав для этого текстовую функцию ДЛСТР из раскрывающегося списка (если в списке ее нет, то нужно выбрать "Другие функции", категория "Текстовые", функция ДЛСТР).

18

Применить для ячейки. содержащей сообщение, абсолютную адресацию (знак $ ввести с клавиатуры или использовать клавишу F4).

Распространить формулу на весь столбец.

Пример из строки формул: =C3/ДЛСТР($A$1)

11.Заполнить оставшиеся столбцы таблицы, используя функцию LOG (на ленте вкладка "Формулы", диалоговое окно "Библиотека функций", кнопка "Математические", функция "LOG"), знак умножения "*" и распространяя (копируя) формулы по столбцам таблицы.

Пример из строки формул: =LOG(1/D3;2) Пример из строки формул: =D3*E3

12.Строку "Сумма" подсчитать с помощью математической функции СУММ (на ленте вкладка "Формулы", диалоговое окно "Библиотека функций", кнопка "Математические", функция "СУММ").

19

Пример из строки формул: =СУММ(C3:C20)

13.Отформатируйте таблицу. Округлите результаты до 4-х знаков после запятой, вызвав контекстное меню правой кнопкой мыши (команда "Формат ячеек") и выбрав вкладку "Число", тип данных - числовой, число десятичных знаков - 4.

14.Проверьте результаты работы. Сумма вероятностей должна получиться равной 1, а сумма частот - длине сообщения (39 символов). Заполненная таблица № 1 должна иметь следующий вид:

Данные - это зарегистрированные сигналы

Символ

Частота

Pi

log2(1/Pi)

Pi*log2(1/Pi)

log2(Pi)

Pi*log2(Pi)

 

 

 

 

 

 

 

 

1

д

1

0,0256

5,2854

0,1355

-5,2854

-0,1355

 

 

 

 

 

 

 

 

2

а

4

0,1026

3,2854

0,3370

-3,2854

-0,3370

3

н

5

0,1282

2,9635

0,3799

-2,9635

-0,3799

4

ы

3

0,0769

3,7004

0,2846

-3,7004

-0,2846

5

е

3

0,0769

3,7004

0,2846

-3,7004

-0,2846

6

-

1

0,0256

5,2854

0,1355

-5,2854

-0,1355

7

пробел

4

0,1026

3,2854

0,3370

-3,2854

-0,3370

8

э

1

0,0256

5,2854

0,1355

-5,2854

-0,1355

9

т

2

0,0513

4,2854

0,2198

-4,2854

-0,2198

10

о

2

0,0513

4,2854

0,2198

-4,2854

-0,2198

11

з

1

0,0256

5,2854

0,1355

-5,2854

-0,1355

12

р

3

0,0769

3,7004

0,2846

-3,7004

-0,2846

13

г

2

0,0513

4,2854

0,2198

-4,2854

-0,2198

14

и

3

0,0769

3,7004

0,2846

-3,7004

-0,2846

15

с

2

0,0513

4,2854

0,2198

-4,2854

-0,2198

16

в

1

0,0256

5,2854

0,1355

-5,2854

-0,1355

17

л

1

0,0256

5,2854

0,1355

-5,2854

-0,1355

20

Сумма

39

1,0000

3,8847

-3,8847

15.Сохраните результаты работы.

16.Создать таблицу № 2 для результатов. Вставить в таблицу заголовки строк и величины: длину сообщения и алфавит N.

Результаты

Длина сообщения

39

символов

 

 

 

 

 

 

 

Алфавит (N)

 

 

 

17

символов

 

 

 

 

Энтропия

 

 

Количество информации по формуле Шеннона (вариант 1)

 

 

N

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

H Pi log2

Pi

 

 

 

i 1

 

 

 

 

Количество информации по формуле Шеннона (вариант 2)

 

 

N

 

Pi

 

 

H Pi log2

 

 

i 1

 

 

 

 

 

Количество информации по формуле Хартли в битах (вариант 1)

 

 

H log2 N

 

 

 

 

 

Количество информации по формуле Хартли в битах (вариант 2)

 

 

1

 

 

 

 

 

H log2

 

 

 

 

 

 

 

 

 

 

 

N

 

 

 

 

 

Количество информации по формуле Хартли в натах

 

 

Количество информации по формуле Хартли в хартли (дитах)

 

 

17.Вставить величину энтропии по формуле Шеннона (вариант 1) как ссылку, щелкнув на уже полученный результат в таблице № 1.

Пример из строки формул: =F21

18.Рассчитать и вставить в таблицу величину энтропии по формуле Шеннона (вариант 2). используя уже полученный результат в таблице № 1.

Пример из строки формул: =-H21

19.Результаты расчета по формуле Шеннона для двух вариантов должны совпасть.

20.Заполнить строку расчета по формуле Хартли (вариант 1), используя функцию LOG (на ленте вкладка "Формулы", диалоговое окно "Библиотека функций", кнопка "Математические", функция "LOG").