Kolokvium / ЯСИН
.DOCИНФОРМАЦИЯ И СИСТЕМА ИНФОРМАЦИИ
Что такое информация?
Обычно информацию отождествляют со знаниями, сведениями, данными. Пока в силу описанных выше факторов не выросло значение информации и не определились новые проблемы и аспекты ее исследования, такое представление было допустимым. Но вот условия изменились. Стали создаваться мощные и дорогостоящие информационные системы. .Затраты на информацию, прежде растворявшиеся в общей сумме производственных и управленческих расходов и поэтому незаметные, стали исчисляться миллиардами. При этом выяснилось, что собираемые и обрабатываемые данные далеко не равноценны, что одни данные, пусть небольшие по объему, очень важны и для их получения целесообразно создавать самые сложные информационные системы, другие же, несмотря на большой объем, мало что дают для управления. Мы и раньше знали, что короткое сообщение может быть содержательнее пухлых докладов и отчетов. Но какие законы определяют различие между ними - этого мы не знали.
Первый шаг в раскрытии этих законов был сделан с возникновением в 40-х годах XX века так называемой «статистической» теории информации, создателями которой были Клод Шеннон и Норберт Винер. Большой вклад в ее разработку внесли также советские ученые А. Н. Колмогоров и В. А. Котельников. Статистической ее называют потому, что информация в этой теории определяется на основе вероятностей тех или иных событий.
Для этого вводится мера неопределенности некоторого события, имеющего несколько разных исходов. Если все исходы события равновероятны, то его неопределенность принимается равной логарифму числа исходов, причем на каждый исход из общей неопределенности приходятся одинаковые доли, равные их вероятности. В более общем случае, когда вероятности разных исходов не равны, неопределенность одного исхода измеряется логарифмом его вероятности, а неопределенность всего события - средней из неопределенностей отдельных исходов, взвешенных по их вероятностям. Исчисляемая таким образом величина в теории информации называется энтропией.
На основе понятия энтропии строится и количественное определение информации, которая в статистической теории трактуется как мера уменьшения неопределенности при совершении какого-либо события. Информацию об одном из исходов некоторого события можно представить как разность его неопределенностей до и после события. При этом оказывается, что чем больше вероятность исхода до осуществления события, тем меньше количество информации, получаемое при его совершении. "
Чем более неожиданно сообщение, чем менее вероятно оно, тем больше информации оно содержит. Такое определение информации хорошо согласуется с широко распространенным представлением.
Разработав меру количества информации, статистическая теория информации впервые доказала, что данные нельзя отождествлять с информацией. Информация содержит лишь те данные, которые уменьшают неопределенность интересующих нас событий, т. е. вновь получаемые сведения, а количество содержащейся в них информации зависит от того, насколько их нельзя было предвидеть заранее. Статистическая теория информации зародилась на почве анализа передачи сообщении по каналам связи, т. е. в области, прямо не связанной с проблемами управления. Уже позднее обнаружилась возможность обобщения теории информации и приложения ее результатов к решению проблем управления. В частности, было показано, что всякий орган управления (регулятор) может рассматриваться как канал связи. При этом его мощность, т. е. способность к выработке эффективных управляющих воздействий, не может превышать его пропускной способности как канала связи с учетом возникающих в канале помех. Это утверждение получило название закона необходимого разнообразия. Он требует, чтобы при этом принимались во внимание объемы потоков информации и пропускная способность элементов (людей н машин), из которых строится система управления. Если один центральный орган управления не обладает необходимым разнообразием, структура управления становится иерархической, многоуровневой. Применение элементов с более высокой пропускной способностью, например ЭВМ вместо арифмометров, создает предпосылки для сокращения числа уровней, упрощения структуры управления.
Статистическая теория информации оказала большое влияние на глубину познания природы информационных процессов и разработку методов их организации. В то же время, будучи развита прежде всего для решения проблем передачи сообщений, она страдает известной ограниченностью. Основной ее минус в том, что она не принимает во внимание ни содержания сообщений, ни ценности их для конкретных получателей, а неожиданность является единственным критерием информативности.
Разумеется, экономисты легко обнаруживают ограниченность статистической теории. Они знают, что показатели, вовсе не неожиданные, могут быть весьма содержательными и ценными в зависимости от того, что они отображают и для решения каких задач используются. Иначе говоря, неожиданность сообщения - это важный, но не единственный фактор, определяющий его информативность для конкретного получателя.
Другие факторы удается выделить на основе современной теории знаковых систем - семиотики. Предметом семиотики является процесс общения (коммуникации) внутри группы получателей и отправителей сообщений, язык как средство общения. Язык рассматривается при этом как знаковая система, т. е. совокупность знаков и правил их использования для выражения того или иного содержания. Знаком (z) может быть любой материальный объект, если он оказывается элементом так называемой знаковой ситуации. Знаковая ситуация, предполагает наличие следующих элементов: 1) совокупности знаков с заданными способами их различения - языка Z, 2) совокупности различимых объектов реального мира А: каждый объект а е А обозначается определенным знаком, например z, т. е. z является обозначением а, который в этом отношении есть обозначаемое; 3) совокупности понятий S, отражающих реальные объекты в памяти получателей и отправителей информации: каждое понятие s е S является отражением определенного объекта, например а, и образует значение (или смысловое значение) обозначающего его знака z, 4) группы получателей и отправителей сообщений М: каждый член этой группы т е M получает или отправляет сообщения, выраженные в языке Z, причем не только воспринимает, но и оценивает их, соответственно изменяя свое поведение.
Отношения между знаками в языке Z взятые независимо от их содержания (значения) и ценности для тех или иных получателей, изучаются особым аспектом семиотики - синтактикой. Из сказанного выше следует, что статистическая теория информации исследует информацию главным образом в этом аспекте.
Отношения между знаками и обозначаемыми ими объектами (z - а), знаками и их значениями (z - s), а также между объектами и отражающими их понятиями (а - s) образуют предмет другого аспекта семиотики - семантики. Семантика изучает содержание сообщений - то, что упускается из виду теорией информации. Содержанием сообщения является знание - упорядоченное определенным образом отражение в понятиях, суждениях и других построенных из понятий образах объектов и процессов реального мира. Чтобы воспринять содержание сообщения, получатель сам должен располагать определенным запасом знаний. Последний в семиотике и информатике называют тезаурусом. Восприятие содержания знака состоит в том, что из тезауруса должно быть вызвано понятие, являющееся его значением. Если значение знака не будет установлено, знак не доставит получателю никакой информации, каким бы неожиданным он ни был.
Отношения между знаками и их получателями (z - m) в плане оценки и влияния их на поведение последних изучаются еще одним аспектом семиотики - прагматикой. Прагматика занимается ценностью сообщений в связи с теми задачами, которые решает их получатель в процессе своей практической деятельности. Чтобы оценить сообщение, его вначале надо принять (по физическому каналу связи) и понять (с помощью тезауруса). Это означает, что прагматический аспект исследования информации является·наиболее конкретным, учитывающим и синтаксические, и семантические отношения между знаками.
. Рассмотрим процесс восприятия сообщения в целом. Вначале сообщение, представленное упорядоченной последовательностью знаков передается по физическому каналу связи и принимается. Качество приема зависит от физического шума в канале и приемнике, от пропускной способности последнего. В этом смысле можно говорить, что при восприятии сообщение проходят физический фильтр. То, что прошло через него, можно считать информацией синтаксической или, статистической, т. е. информацией в смысле классической теории.
Далее эта информация должна быть понята, усвоена получателем. Для, этого сообщение должно пройти тезаурус (тезаурус в переводе с латинского языка означает сокровище, сейчас этим термином чаще всего обозначают систематический словарь понятий, в котором фиксируются как сами понятия, так и постоянные, не зависящие от контекста, отношения между ними, например классификационные), играющий роль семантического фильтра, отсеивающего семантический шум. Последний может возникнуть, например, в силу того, что в тезаурусе получателя отсутствуют понятия, являющиеся значениями знаков сообщения. В этом случае говорят, что тезаурус и сообщение не имеют общих точек, не пересекаются. Возможен другой случай, когда все содержание сообщения уже имеется в тезаурусе, включено в него. Тогда получатель опять же не получит никакой информации, не узнает ничего нового, и то, что даже понято им, тоже можно считать семантическим шумом. Советские ученые Ю. Шрейдер и И.Грекова предложили считать информацией ту часть содержания сообщения, которая составляет приращение тезауруса получателя. Оно образуется тогда, когда, с одной стороны, тезаурус получателя и содержание сообщения имеют достаточное количество общих точек, чтобы было возможным понимание, а с другой - в сообщении содержатся сведения, новые для получателя. Их восприятие обеспечивается зафиксированными в тезаурусе ассоциативными связями между понятиями: благодаря им новым понятиям находится в памяти место, они пристраиваются к тезаурусу, увязываются с другими понятиями.
Для данного получателя сообщение содержит только семантический шум и тогда, когда оно не имеет общих точек с тезаурусом, и в случае полного совпадения с ним. При оптимальной степени пересечения сообщения и тезауруса достигается максимальное приращение тезауруса, т. е. из сообщения извлекается максимум информации.
Такую информацию можно назвать семантической. Она не только принята, но и понята получателем. Но это не все. Содержание сообщения может быть принято, понятно, и все же не исключено, что для конкретного получателя оно не доставит информации, если он не найдет в нем нечто полезное для решения стоящих перед ним задач, если он не настроен на восприятие и использование его. Содержание сообщения должно быть еще оценено. Эту функцию выполняет третий, прагматический фильтр. Сведения, которые бесполезны для решения актуальных задач, отсекаются им как прагматический шум. И только те, которые считаются полезными с этой точки зрения, оцениваются как информация. Ее можно было бы назвать прагматической. Однако следует иметь в виду, что в практике управления и в общении между людьми вообще только эту информацию в конечном счете и считают информацией. Статистическая и семантическая информация может считаться информацией только в определенных частных случаях, когда от оценки полезности сообщений можно отвлечься. При изучении передачи сообщений по каналам связи, например, можно отвлечься и от содержания, и от ценности их. В оперативном управлении неожиданность (вероятность) сообщения ценится так высоко, что прочие факторы тоже можно оставить в стороне, хотя они предполагаются. В процессе обучения новые знания, расширяющие тезаурус обучаемого, приобретают самостоятельную ценность независимо- от того, будут или не будут они использоваться в дальнейшем. Это тот случай, когда можно отвлечься от ценности получаемых знаний. Но в практической деятельности чаще всего именно оценка дает окончательное заключение относительно того, какие сведения можно считать информацией.
Таким образом, под информацией условимся понимать новые знания, принятые, понятые и оцененные как полезные для решения тех или иных задач. Информация - это то, что доведено до получателя через тройной фильтр механизма восприятия.
Единицы измерения информации
Для рациональной организации системы информации и оценки ее состояния крайне важно уметь измерять количество информации. Прагматическую информацию мы пока измерять не умеем. Во всяком случае, предложенные способы ее измерения пока нельзя назвать ни адекватными, ни практичными. На практике ограничиваются, по существу, измерением либо объема данных, либо количества информации в статистическом смысле.
Объем данных чаще всего измеряется числом документов, а также цифровых и алфавитных символов. Поскольку документы весьма различны по размеру, в качестве единицы измерения объема данных их можно использовать лишь при грубых оценках или при условии, что подсчет ведется для, массива документов одной формы. Символы в этом отношении более удобны. Однако, являясь знаками, они, как правило, не имеют собственного значения и не являются смысловыми единицами. Таковыми можно было бы считать высказывания (или отдельные предложения) текстов, выражающие законченную мысль. Но подсчет таких единиц содержания затруднен из-за различий в структуре и объемах. Есть, однако, один тип высказываний, весьма распространенных в управлении, подсчет которых не составляет труда. Это элементы количественных данных - показатели.
Существуют два определения показателя. Согласно первому определению, принятому среди экономистов, плановиков, статистиков, под показателем понимается качественно определенная переменная величина, характеризующая тот или иной объект, которой может соответствовать множество количественных значений. Такой показатель имеет определенную методологию измерения или алгоритм расчета. Таковы, например, показатели валовой продукции, среднесписочной численности работающих, среднегодовой стоимости основных фондов. Понятно, что при таком определении показатель не может быть единицей измерения объема данных.
Согласно второму определению, принятому в теории автоматизированной обработки данных, под, показателем понимается высказывание, содержащее количественную характеристику отображаемого объекта. Такое высказывание имеет определенную структуру. В его состав входит единственное количественное значение, называемое иногда основанием, а также набор идентифицирующих его содержательных (качественных) признаков, который удобно назвать идентификатором показателя. Идентификатор показателя в свою очередь делится на две части - наименование показателя, объединяющее основные признаки, выражающие его основной экономический смысл, и дополнение, включающее дополнительные признаки. Последние позволяют однозначно идентифицировать его количественное значение во времени и пространстве. Оказывается, наименование показателя точно соответствует первому из приведенных определений. Например, выражение вида: «Валовая продукция промышленности СССР в 1970 г. в млрд. руб. в оптовых ценах предприятий фактически - 374.3» есть показатель, отвечающий второму определению, но входящее в его идентификатор наименование показателя - валовая продукция, есть не что иное, как показатель в экономическом понимании.
Таким образом, оба определения показателя взаимосвязаны, не противоречат друг другу и оба должны использоваться, поскольку имеют разное назначение. Оба определения можно обобщить, если понимать под показателями вообще количественные данные. Чтобы различать их, условимся называть элементарным показатель, соответствующий второму определению. Одно из его достоинств заключается в том, что он является доступной для подсчетов и притом смысловой единицей измерения объема количественных данных. Достаточно подсчитать число количественных значений или заполненных графоклеток в документах табличной формы.
Производя такого рода подсчеты, можно обнаружить зависимость между объемом данных в алфавитно-цифровых символах и в таких смысловых единицах, какими являются элементарные показатели. Оказывается, что чем больше размер таблицы, тем меньше символов требуется для выражения содержания одного элементарного показателя.
Общепринятой единицей измерения информации в статистическом смысле является неопределенность, устраняемая выбором одного из двух равновероятных исходов, так называемая двоичная единица, или бит. Поскольку в качестве меры неопределенности принята логарифмическая функция, выбор единицы измерения сводится к выбору основания логарифма. Измерение количества информации в битах означает, что единицей измерения является логарифм при основании 2.
Понятно, что количество битов не позволяет судить ни о содержательности сообщения, ни о его ценности для получателя, хотя нельзя утверждать, что мера статистической информации не имеет никакой связи с семантикой или прагматикой. Однако многочисленные попытки построить меру семантической и прагматической информации пока не увенчались успехом. Для измерения содержательности сообщений мы должны были бы научиться измерять приращение тезауруса, а стало быть, знать и объем тезауруса конкретного получателя. Пока это недоступно для нас.
Экономическая информация и ее классификация
В управлении народным хозяйством используются различные виды информации, в том числе и экономическая. Определить экономическую информацию, установить ее особенности можно, только рассмотрев вначале более общее понятие-информацию для управления народным хозяйством, с которой экономическую информацию часто отождествляют. Она может классифицироваться по двум группам признаков: 1) организационным; 2) содержательным (семантическим).
Классификация по организационным признакам распространяется и на эконономическую информацию, хотя не является специфичной для нее. По отношению к данной системе информация делится на внешнюю и внутреннюю, а по отношению к ее системе управления на входную и выходную. Входная внутренняя информация представляет информацию первичную, получаемую в результате прямого наблюдения, регистрации данных о состоянии и действиях управляемого объекта.
Важное значение имеет классификация информации по признаку отношения к операциям обработки данных в системе управления, предложенная М. А. Королевым. Она представлена на рис. 4 [4, с. 99].
Для изучения потоков информации имеет значение ее деление по направлению движения. По этому признаку входная и выходная информация делится на горизонтальную, связывающую органы управления одного уровня, и вертикальную - связывающую органы разных уровней структуры управления. Последняя делится на восходящую, направляемую с нижних уровней на верхние, и нисходящую, направляемую сверху вниз. По назначению относительно данного органа управления различается информация осведомляющая и управляющая. Первая используется для обоснования решений, вторая порождается в процессе принятия решений и направляется к объекту управления для исполнения.
По функциям управления информация делится в зависимости от того, какая функция управления ее вырабатывает. По этому признаку выделяется плановая информация, вырабатываемая планированием, нормативная, прогнозная, учетная, .контрольная, аналитическая и т. д.
Наконец, по степени организации различается информация систематизированная и несистематизированная. Под систематизированной понимается информация, выработка и передача которой регламентируется или по содержанию, или по формам представления, или по временному режиму. Несистематизированная информация не регламентирована.
Для организации информационных процессов важное значение имеет также деление информации по длительности периода, в течение которого она сохраняет свою актуальность и используется в принятии решений. По существу, с этим признаком связано деление информации на постоянную, условно-постоянную и переменную. Однако, как показал Е. З. Майминас, это деление носит относительный характер: для предприятия нормативы затрат труда и материалов - условно - постоянная информация, а для народнохозяйственного планирования - переменная. Для этого признака полезно было бы выделить более устойчивые группировки, например, такие:
1) теоретическая (научная) - результаты фундаментальных и прикладных научных исследований в различных областях, находящие широкое применение в производстве и управлении;
2) стратегическая - сохраняющая актуальность в течение длительных периодов (10 - 15 лет). К ней относятся долгосрочные планы и прогнозы, фактические данные о медленно изменяющихся объектах, проектно-конструкторская информация и т. п.;
-
тактическая ( конъюнктурная) информация - с периодом актуальности в пределах от квартала до 2-3 лет;
-
оперативная информация - сохраняющая актуальность в пределах цикла оперативного управления.
Рассмотрим теперь классификацию информации для управления народным хозяйством по содержательным (семантическим) признакам. Эти признаки делят информацию по отображаемым ею объектам и процессам, их свойствам и отношениям. При, этом воспроизводятся классификации самих объектов отражения. Заметим, что в этом состоит особенность семантических признаков. Организационные признаки относятся к самой информации и могут стать семантическими, но только в том случае, когда объектом отражения становится сама информация, т. е. когда собирается и анализируется информация об информации (метаинформация).
По отображаемым объектам информация может быть разделена, например, на информацию о населении (демографическую), о трудовых ресурсах, о природе и природных ресурсах, о продукции и услугах, О средствах производства, финансах и т. д. Поскольку существуют весьма глубокие классификации этих объектов, они будут одновременно классификациями информации о них.
Например, средства производства делятся на средства труда и предметы труда (по назначению), на основные и оборотные средства (по форме размещения). Соответственно можно группировать и информацию.
Однако различные объекты могут находиться в разных отношениях между собой и соответственно в процессе изучения и управления рассматриваться в разных аспектах. Например, явления природы могут рассматриваться исключительно в плане присущих им внутренних закономерностей. Такой подход к ним свойствен естественным наукам. Но они могут рассматриваться и в плане их производственно - технологического использования как природных ресурсов и в плане возникающих в связи с ними экономических и социальных отношений между людьми. Аспект рассмотрения оказывается чрезвычайно важным с точки зрения содержания информации. Только сего учетом можно более точно определить, что такое экономическая информация.
По признаку отражаемых отношений между объектами модно выделить следующие виды информации:
1) естественнонаучную - об отношениях между природными объектами как таковыми;
-
технико-технологическую - об отношениях между предметами природы, выделяемыми в связи с техникой и технологией их хозяйственного использования; это информация о производительных силах общества и технико - технологических связях между их элементами;
-
экономическую - об отношениях между людьми по поводу производства, распределения, обмена и потребления общественного продукта; это информация о производственных (экономических) отношениях
-
социально-политическую - о прочих социальных, политических, идеологических, морально-этических отношениях между людьми, входящих в понятие общественной надстройки.
Все выделенные виды информации используются в .управлении народным хозяйством, однако это, как мы видим, не означает, что их можно свести только к экономической информации.
В то же время, поскольку экономическая система определяется по - разному - как совокупность производственных отношений или как совокупность производственных отношений с производительными силами, - в более широкое понятие экономической информации включают обычно и экономическую информацию в определенном выше узком смысле, и технико-технологическую информацию. В практике управления между ними, хотя и не всегда четко, но все же проводят различие. Так, в планировании н статистике выделяют так называемые технико-экономические или технико-производственные показатели.
Кроме перечисленных общих признаков, экономическая информация классифицируется также по ряду специфических. В числе последних следует отметить деление по признаку отображаемой фазы или процесса воспроизводства (информация о производстве, обращении, распределении, потреблении), а также по отраслям народного хозяйства (промышленность, сельское хозяйство, строительство, транспорт и т. д.), по территориальным единицам, по организационно-хозяйственным единицам (министерствам, ведомствам, предприятиям и организациям и т. п.).
Поскольку классификация экономической информации по семантическим признакам воспроизводит классификации отражаемых в ней объектов, процессов и отношений, а последние фиксируют логические отношения между соответствующими понятиями и терминами, являющимися их знаками в языке управления народным хозяйством, взаимосвязанная совокупность таких классификаций будет представлять не что иное, как тезаурус экономической информации. Принадлежность конкретного сообщения к тому или иному классу определяется при этом тем, к каким классификациям относятся термины (и образующие их значения понятия), из которых составлено сообщение. Например, в сообщении содержатся плановые показатели производства продукции промышленности СССР. Стало быть, это сообщение относится к группировке, образуемой пересечением (сочетанием позиций) из классификаций экономической информации: 1) по признаку отображаемого объекта (продукция); 2)фазы или процесса воспроизводства (производство); 3) отрасли (промышленность); 4) территории (СССР); 5) функции управления (планирование). Это обстоятельство, как мы увидим, имеет важное значение для организации хранения и поиска данных. Классификация экономической информации, таким образом, оказывается далеко не теоретическим упражнением.