конспект
.pdfпри Sp=0 пользователь не воспринимает, не понимает поступающую информацию;
при Sp → ∞ пользователь все знает, и поступающая информация ему не нужна.
На рис.2 показана зависимость количества семантической информации, воспринимаемой потребителем, от его тезауруса I c = f ( S p )
Рис.2
Максимальное количество семантической информации Ic потребитель приобретает при согласовании ее смыслового содержания S со своим тезаурусом Sp (Sp =Sp opt) когда поступающая информация понятна пользователю и несет ему ранее не известные (отсутствующие в его тезаурусе) сведения.
Следовательно, количество семантической информации в сообщении, количество новых знаний, получаемых пользователем, является величиной относительной. Одно и то же сообщение может иметь смысловое содержание для компетентного пользователя и быть бессмысленным (семантический шум) для пользователя некомпетентного.
При оценке семантического (содержательного) аспекта информации необходимо стремиться к согласованию величин S и Sp.
Относительной мерой количества семантической информации может служить коэффициент содержательности С, который определяется как отношение количества семантической информации к ее объему:
C = I c V Д
21
Прагматическая мера информации. Эта мера определяет полезность информации (ценность) для достижения пользователем поставленной цели. Эта мера также величина относительная, обусловленная особенностями использования этой информации в той или иной системе. Ценность информации целесообразно измерять в тех же самых единицах (или близких к ним), в которых измеряется целевая функция.
Например, в экономической системе прагматические свойства (ценность) информации можно определить приростом экономического эффекта функционирования, достигнутым благодаря использованию этой информации для управления системой:
Iпβ( γ) = П( γ/ β) −П( γ) ,
где I пβ( γ) - ценность информационного сообщения β для системы управления γ,
П( γ) - априорный ожидаемый экономический эффект функционирования системы управления γ,
П( γ/ β) - ожидаемый эффект функционирования системы γ при
условии, что для управления будет использована информация, содержащаяся в сообщении β.
2.3. Качество информации
Возможность и эффективность использования информации обусловливаются такими основными ее потребительскими показателями качества, как репрезентативность, содержательность, достаточность, доступность, актуальность, своевременность, точность, достоверность, устойчивость.
Репрезентативность информации связана с правильностью ее отбора и формирования в целях адекватного отражения свойств объекта. Важнейшее значение здесь имеют:
-правильность концепции, на базе которой сформулировано исходное понятие;
-обоснованность отбора существенных признаков и связей отображаемого явления.
Нарушение репрезентативности информации приводит нередко к существенным ее погрешностям.
22
Содержательность информации отражает семантическую емкость, равную отношению количества семантической информации в сообщении к объему обрабатываемых данных, т.е.
C = I c V Д
С увеличением содержательности информации растет семантическая пропускная способность информационной системы, так как для получения одних и тех же сведений требуется преобразовать меньший объем данных.
Наряду с коэффициентом содержательности С, отражающим семантический аспект, можно использовать и коэффициент
информативности, |
характеризующийся |
отношением |
количества |
||
синтаксической информации (по Шеннону) к объему данных |
|
||||
|
Y = |
I |
. |
|
|
|
|
|
|
||
|
V Д |
|
|
Достаточность (полнота) информации означает, что она содержит минимальный, но достаточный для принятия правильного решения состав (набор показателей). Понятие полноты информации связано с ее смысловым содержанием (семантикой) и прагматикой. Как неполная, т.е. недостаточная для принятия правильного решения, так и избыточная информация снижает эффективность принимаемых пользователем решений.
Доступность информации восприятию пользователя обеспечивается выполнением соответствующих процедур ее получения и преобразования. Например, в информационной системе информация преобразовывается к доступной и удобной для восприятия пользователя форме. Это достигается, в частности, и путем согласования ее семантической формы с тезаурусом пользователя.
Актуальность информации определяется степенью сохранения ценности информации для управления в момент ее использования и зависит от динамики изменения ее характеристик и от интервала времени, прошедшего с момента возникновения данной информации.
Своевременность информации означает ее поступление не позже заранее назначенного момента времени, согласованного с временем решения поставленной задачи.
Точность информации определяется степенью близости получаемой информации к реальному состоянию объекта, процесса, явления и т.п. Для информации, отображаемой цифровым кодом, известны четыре классификационных понятия точности:
23
-формальная точность, измеряемая значением единицы младшего разряда числа;
-реальная точность, определяемая значением единицы последнего разряда числа, верность которого гарантируется;
-максимальная точность, которую можно получить в конкретных условиях функционирования системы;
-необходимая точность, определяемая функциональным назначением показателя.
Достоверность информации определяется ее свойством отражать реально существующие объекты с необходимой точностью. Измеряется достоверность информации доверительной вероятностью необходимой точности, т.е. вероятностью того, что отображаемое информацией значение параметра отличается от истинного значения этого параметра в пределах необходимой точности.
Устойчивость информации отражает ее способность реагировать на изменения исходных данных без нарушения необходимой точности. Устойчивость информации, как и репрезентативность, обусловлена выбранной методикой ее отбора и формирования.
24
3.Представление информации в ЭВМ
3.1.Позиционные системы счисления
Впривычной для нас десятичной системе счисления используют 10 цифр: 0,1,2,…,9 и каждое число представлено как :
N= m∑−1ai10i i=−s
где i – номер разряда,
a – одна из цифр от 0 до 9,
s – количество разрядов в дробной части числа, m - количество разрядов в целой части числа.
Например, 405.35=4*102+0*101+5*100+3*10-1+5*10-2
Но десятичная система счисления далеко не единственно возможная. В общем случае число N в некоторой позиционной системе счисления с основанием P записывается как
N= m∑−1ai P i , i=−s
где a –цифра от 0 до P-1,
P – основание системы счисления.
Позиционными системами счисление называются такие, у которых вес каждой цифры a зависит от позиции в изображении числа. Так римская система счисления непозиционная.
Максимальное целое число, которое может быть представлено в m разрядах:
N max = P m −1.
Минимальное значащее (не равное 0) число, которое можно записать в s разрядах дробной части:
N min = P −s .
Для представления информации в ЭВМ используется двоичная или двоично-десятичная система счисления. В двоичной системе только две цифры 0 и 1. Важное достоинство двоичной системы счисления – удобство физического представления цифр. Любой носитель компьютерной
25
информации (триггер, магнитный сердечник, домен) может принимать двоичное значение «есть сигнал / нет сигнала».
Любое число в двоичной системе представляет несколькими двоичными разрядами, каждый разряд несет информацию равную 1 биту. Поэтому каждый разряд и называют просто битом. Пример двоичного числа с дробной частью:
1010.0012=1*23+0*22+1*21+0*20+0*2-1+0*2-2+1*2-3=10.12510.
Недостаток двоичной системы – слишком громоздкая запись. Например,
17310=10101101.
Поэтому она используется «внутри» ЭВМ, а для представления двоичных кодов человеку часто применяют восьмеричную и шестнадцатеричную системы счисления. В восьмеричной используют цифры от 0 до 7. Например,
2578=2*82+5*81+7*80=17510.
В шестнадцатеричной используют цифры от 0 до 9 и добавляются новые цифры: A = 10, B = 11, C = 12, D = 13, E = 14, F = 15.
Например, 3E5A116=3*164+E*163+5*162+A*161+1*160=3*164+14*163+5*162+10*161+1* 160 =25539310
Чем больше основание СС, тем компактнее запись чисел.
Итак, выше приведены примеры перевода чисел из двоичной, восьмеричной и шестнадцатеричной систем счисления в десятичную.
Алгоритм обратного перевода заключается в следующем. Число в десятичной системе счисления последовательно делится на основание системы счисления, в которую надо переводить. В качестве цифр нового представления берутся остатки от деления в обратном порядке, начиная с младшего остатка.
На рис.3 приведен пример перевода 1010 в двоичную систему.
10 |
|
2 |
|
|
0 |
5 |
2 |
|
|
|
1 |
2 |
2 |
|
|
|
0 |
1 |
2 |
|
|
|
||
|
|
|
1 |
0 |
|
|
|
|
Рис.3
26
Таким образом 1010=10102 .
Для перевода дробных частей десятичных чисел используют следующий алгоритм. Число в десятичной системе счисления необходимо последовательно умножать на основание системы счисления, в которую надо переводить. Причем умножать надо только очередную дробную часть, игнорируя возникающие целые части. В качестве цифр берутся целые части результатов умножения. Так происходит до тех пор, пока дробная часть не станет равной нулю или не достигается заданная точность.
На рис.4 приведен пример перевода 0.62510 в двоичную систему счисления.
0.625 * 2
1.250 * 2 0.500 * 2 1.000
Рис.4
Таким образом, 0.62510=0.1012.
Для перевода из двоичной в восьмеричную систему счисления число в двоичной системе необходимо разбить по три цифры (на триады) справа налево, и вместо каждой триады записать восьмеричную цифру соответствующую двоичному коду триады. Например, необходимо перевести 11011110112 в восьмеричную систему счисления, тогда
001 101 111 011
1 5 7 3 Таким образом, 11011110112=15738.
Аналогично, при переводе в шестнадцатеричную систему счисления двоичное число разбивается по четыре цифры (на тетрады). Например, переведем 11011110112 в шестнадцатеричную систему счисления.
0011 0111 1011
3 7 11 Таким образом, 11011110112=37В16 .
Обратный перевод из восьмеричной или шестнадцатеричной системы счисления в двоичную очень прост, каждая цифра записывается в двоичном коде по триадам или тетрадам.
27
1238 = 1 010 0112 А1716 = 1010 0001 01112 .
Для изображения двоичных чисел часто используют двоичнодесятичную систему счисления. В этой системе для изображения каждой десятичной цифры отводится тетрада. Например, десятичное число 925 в двоично-десятичной системе запишется в виде 1001 0010 0101. Следует обратить внимание, что эта запись отличается от двоичного изображения данного числа. Например, приведенный выше код в двоичной системе изображает число 234110.
3.2.Форматы представления чисел
Ввычислительных машинах применяются две формы представления двоичных чисел:
•естественная форма или форма с фиксированной запятой (точкой);
•нормальная форма или форма с плавающей запятой (точкой).
С фиксированной запятой все числа изображаются в виде последовательности цифр с постоянным для всех чисел положением запятой, разделяющей целую часть от дробной. Например, пусть десятичной системе счисления имеются 5 разрядов в целой части числа (до запятой) и 5 разрядов в дробной части числа (после запятой); числа, записанные в такую разрядную сетку, имеют вид:
+00721,35500; +00000,00328; -10301,20260.
Эта форма наиболее проста, естественна, но имеет небольшой диапазон представления чисел и поэтому не всегда приемлема при вычислениях.
Диапазон значащих чисел N в системе счисления с основанием Р при наличии m разрядов в целой части и s разрядов в дробной части числа (без учета знака числа) будет:
P-s ≤ N ≤ Pm-1. При P=2, m=10 и s=6: 0,015625 ≤ N ≤ 1023. При P=2, m=16 и s=0: 0 ≤ N ≤ 65535.
При P=2, m=0 и s=15: 0,000030517578125 ≤ N ≤ 0.
Если в результате операции получится число, выходящее за допустимый диапазон, происходит переполнение разрядной сетки, и дальнейшие вычисления теряют смысл. В современных ЭВМ естественная
28
форма представления используется как вспомогательная и только для целых чисел.
С плавающей запятой каждое число изображается в виде двух групп цифр. Первая группа цифр называется мантиссой, вторая – порядком, причем абсолютная величина мантиссы должна быть меньше 1, а порядок
— целым числом. В общем виде число в форме с плавающей запятой может быть представлено так:
N = ±MP ± r
где М — мантисса числа (│М│ < 1);
r — порядок числа (r - целое число); Р—основание системы счисления.
Приведенные выше числа в нормальной форме запишутся так: +0,721355*103; +0,328•10-2; - 0,103012026*105.
Нормальная форма представления имеет огромный диапазон отображения чисел и является основной в современных ЭВМ. Диапазон значащих чисел в системе счисления с основанием Р при наличии m разрядов у мантиссы и s разрядов у порядка (без учета знаковых разрядов порядка и мантиссы) будет:
P −m P −( P s −1) ≤ N ≤(1−P −m )P( P s −1)
При P=2, m=10 и s=6: 10-22<N<1019
Знак числа обычно кодируется двоичной цифрой, при этом код 0 означает знак "+", код 1 — знак "-".
Для алгебраического представления чисел (т.е. для представления положительных и отрицательных чисел) в машинах используются специальные коды: прямой, обратный и дополнительный. Причем два последних позволяют заменить неудобную для ЭВМ операцию вычитания на операцию сложения с отрицательным числом; дополнительный код обеспечивает более быстрое выполнение операций, поэтому в ЭВМ применяется чаще именно он.
Для удобства работы введены следующие термины, обозначающие совокупности двоичных разрядов. Эти термины обычно используются в качестве единиц измерения объемов информации, хранимой или обрабатываемой в ЭВМ.
1 бит = 1 двоичный разряд,
1 байт = 8 бит,
1 слово = 2 байта, 1 килобайт (Кбайт или Кб или К) = 210 байт = 1024 байт,
29
1 мегабайт (Мбайт или Мб или М) = 220 байт = 1024 Кбайт = 1 048
576байт,
1гигабайт (Гбайт или Гб или Г) = 230 байт = 1024 Мбайт = 220
Кбайт = 1 073 741 824 байт,
1 терабайт (Тбайт или Тб или Т) = 240байт= 1024 Гбайт = 220 Мбайт
= 1 099 511 627 776 байт.
Последовательность нескольких битов или байтов часто называют полями данных. Биты в числе (в слове, в поле и т.п.) нумеруются справа налево, начиная с 0-го разряда.
В ПК могут обрабатываться поля постоянной и переменной длины. Поля постоянной длины:
слово — 2 байта двойное слово — 4 байта
расширенное слово—8 байт
Числа с фиксированной запятой чаще всего имеют формат слова и байта, числа с плавающей запятой—формат двойного слова (Single), слова из 6 байт (Real), расширенного слова (Double) и слова из 10 байт
(Extended).
Поля переменной длины могут иметь любой размер от 0 до 256 байт, но обязательно равный целому числу байтов.
Запись числа –19310= -110000012 в разрядной сетке ПК в формате с фиксированной запятой приведена на рис.5.
|
Знак |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
числ. |
|
|
|
|
|
Абсолютная величина числа |
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
№ |
15 |
14 |
13 |
12 |
11 |
10 |
9 |
8 |
7 |
6 |
5 |
4 |
3 |
2 |
1 |
0 |
разр |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Чис |
1 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
1 |
1 |
0 |
0 |
0 |
0 |
0 |
1 |
ло |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Рис.5
30