Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ЛАБОРАТОРНАЯ РАБОТА1.doc
Скачиваний:
27
Добавлен:
01.04.2015
Размер:
91.65 Кб
Скачать

3. Содержательный (вероятностный) подход при разной вероятности возникновения события.

Бывают случаи, когда поступает сообщение о не равновероятных событиях. Тогда, если N – это общее число возможных исходов какого-то процесса(вытаскивание шара, получение оценки, ловля рыбы),и из них интересующее нас событие(вытаски­вание белого шара, получение пятерки, попадание щуки) может произойти К раз, то вероятность этого события равна p =K/N.

Вероятность выражается в долях единицы. В частном слу­чае, вероятность достоверного события равна 1 (из 50 белых шаров вытащен белый шар); вероятность невозможного собы­тия равна нулю (из 50 белых шаров вытащен черный шар).

Качественную связь между вероятностью события и коли­чеством информации в сообщении об этом событии можно вы­разить так: чем меньше вероятность некоторого события, тем больше информации содержит сообщение об этом событии.

Количественная зависимость между вероятностью события (р) и количеством информации в сооб­щении о нем (i) выражается формулой:

i=log2 (1/p)

Пример 3.1.В коробке имеется 50 шаров. Из них 40 белых и 10 черных. Очевидно, вероятность того, что при вытаски­вании «не глядя» попадется белый шар больше, чем вероятность попадания черного. Затем определим количество ин­формации в сообщении о попадании белого шара и чер­ного шара.

Решение.Обозначим рч– вероятность попадания при вытаскивании черного шара, рб– вероятность попада­ния белого шара. Тогда:

рч = 10/50 = 0,2; р6= 40/50 = 0,8.

Отсюда видно, что вероятность попадания белого шара в 4 раз больше, чем черного.

iб = log 2 (l/0,8) = log 2 (l,25) = 0,321928;

iч =log2(l/0,2) =log2 5 = 2,321928.

Вероятностный метод применим и для алфавитного под­хода к измерению информации, заключенной в тексте. Известно, что разные символы (буквы алфавита, знаки препинания и др.) встречаются в тексте с разной час­тотой и, следовательно, имеют разную вероятность. Значит, измерять информационный вес каждого символа в тексте так, как это делалось раньше (в предположении равновероятности), нельзя.

Пример 3.2.В алфавите племени МУМУ всего 4 буквы (А, У, М, К), один знак препинания (точка) и для разделения слов используется пробел. Подсчитали, что в популярном романе «Мумука» содержится всего 10000 знаков, из них: букв А – 4000, букв У – 1000, букв М – 2000, букв К – 1500, точек – 500, пробелов – 1000. Какой объем ин­формации содержит книга?

Решение. Поскольку объем книги достаточно большой, то можно до­пустить, что вычисленная по ней частота встречаемости в текс­те каждого из символов алфавита характерна для любого текста языке МУМУ. Подсчитаем частоту встречаемости каждого символа во всем тексте книги (т.е. вероятность) и информационные веса символов:

буква А: 4000/10000 = 0,4; iA=log2(1/0,4) = 1,321928;

буква У: 1000/10000 = 0,1; iУ=log2(1/0,1) = 3,1928;

буква М: 2000/10000 = 0,2; iМ=log2(1/0,2) = 2,321928;

буква К: 1500/10000 = 0,15; iК=log2(1/0,15) = 2,736966;

точка: 500/10000 = 0,05; iточка=log2(1/0,05) = 4,321928;

пробел: 1000/10000 = 0,1; iпробел=log2(1/0,1) = 3,321928.

Общий объем информации в книге вычислим как суму произведений информационного веса каждого символа на число повторений этого символа в книге:

I=iА×nА+iУ×nУ+iМ×nМ+iК×nК+iточка×nточка+iпробел×nпробел=

=1,321928×4000+3,1928×1000+2,321928×2000+2,736966×1500+4,321928×500+3,321928×100=22841,84 бита.

Задачи

3.1. В корзине лежат 8 черных шаров и 24 белых. Сколько информации несет сообщение о том, что достали черный шар?

3.2. В корзине лежат 32 клубка шерсти. Среди них – 4 красных. Сколько информации несет сообщение о том, что достали клубок красной шерсти?

3.3. В коробке лежат 64 цветных карандаша. Сообщение о том, что достали белый карандаш, несет 4 бита информации. Сколько белых карандашей было в корзине?

3.4. В ящике лежат перчатки (белые и черные). Среди них – 2 пари черных. Сообщение о том, что из ящика достали пару черных перчаток, несет 4 бита информации. Сколько всего пар перчаток было в ящике?

3.5. В классе .30 человек. За контрольную работу по математике получено 6 пятерок, 15 четверок, 8 троек и 1 двойка. Какое количество информации в сообщении о том, что Иванов полу­чил четверку?

3.6. Известно, что в ящике лежат 20 шаров. Из них 10 – черных, 5 – белых, 4 – желтых и 1 – красный. Какое количество информации несут сообщения о том, что из ящика случайным образом достали черный шар, белый шар, желтый шар, красный шар?

3.7. За четверть ученик получил 100 оценок. Сообщение о том, что он получил четверку, несет 2 бита информации. Сколько четверок ученик получил за четверть?

3.8. В корзине лежат белые и черные шары. Среди них 18 черных шаров. Сообщение о том, что из корзины достали белый шар, несет 2 бита информации. Сколько всего в корзине шаров?

3.9. Частотный словарь русского языка – словарь вероятностей (частот) появления букв в произвольном тексте – приведен ниже. Определите, какое количество информации несет каждая буква этого словаря.

Символ

Частота

Символ

Частота

Символ

Частота

Символ

Частота

о

0.090

в

0.035

я

0.018

ж

0.007

е, ё

0.072

к

0.028

ы, з

0.016

ю, ш

0.006

а, и

0.062

м

0.026

ь, ъ, б

0.014

ц, щ, э

0.003

т,н

0.053

д

0.025

ч

0.013

ф

0.002

с

0.045

п

0.023

й

0.012

р

0.040

у

0.021

х

0.009

3.10. Используя результат решения предыдущей задачи, определите количество информации в слове «ИНФОРМАТИКА».