Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Kolokvium / ЯСИН

.DOC
Скачиваний:
31
Добавлен:
19.04.2013
Размер:
40.96 Кб
Скачать

ИНФОРМАЦИЯ И СИСТЕМА ИНФОРМАЦИИ

Что такое информация?

Обычно информацию отождествляют со знаниями, све­дениями, данными. Пока в силу описанных выше факто­ров не выросло значение информации и не определились новые проблемы и аспекты ее исследования, такое пред­ставление было допустимым. Но вот условия изменились. Стали создаваться мощные и дорогостоящие информационные системы. .Затраты на информацию, прежде растворявшиеся в общей сумме производственных и уп­равленческих расходов и поэтому незаметные, стали ис­числяться миллиардами. При этом выяснилось, что соби­раемые и обрабатываемые данные далеко не равноценны, что одни данные, пусть небольшие по объему, очень важны и для их получения целесообразно создавать самые сложные информационные системы, другие же, несмотря на большой объем, мало что дают для управления. Мы и раньше знали, что короткое сообщение может быть содержательнее пухлых докладов и отчетов. Но какие законы определяют различие между ними - этого мы не знали.

Первый шаг в раскрытии этих законов был сделан с возникновением в 40-х годах XX века так называемой «статистической» теории информации, создателями кото­рой были Клод Шеннон и Норберт Винер. Большой вклад в ее разработку внесли также советские ученые А. Н. Колмогоров и В. А. Котельников. Статистической ее назы­вают потому, что информация в этой теории определяет­ся на основе вероятностей тех или иных событий.

Для этого вводится мера неопределенности некото­рого события, имеющего несколько разных исходов. Если все исходы события равновероятны, то его неопределен­ность принимается равной логарифму числа исходов, причем на каждый исход из общей неопределенности приходятся одинаковые доли, равные их вероятности. В более общем случае, когда вероятности разных исхо­дов не равны, неопределенность одного исхода измеряет­ся логарифмом его вероятности, а неопределенность все­го события - средней из неопределенностей отдельных исходов, взвешенных по их вероятностям. Исчисляемая таким образом величина в теории информации называет­ся энтропией.

На основе понятия энтропии строится и количествен­ное определение информации, которая в статистической теории трактуется как мера уменьшения неопределенности при совершении какого-либо события. Информа­цию об одном из исходов некоторого события можно представить как разность его неопределенностей до и после события. При этом оказывается, что чем больше вероятность исхода до осуществления события, тем мень­ше количество информации, получаемое при его совершении. "

Чем более неожиданно сообщение, чем менее вероятно оно, тем больше информации оно содержит. Такое определение информации хорошо согласуется с широко распространенным представлением.

Разработав меру количества информации, статистическая теория информации впервые доказала, что дан­ные нельзя отождествлять с информацией. Информация содержит лишь те данные, которые уменьшают неопреде­ленность интересующих нас событий, т. е. вновь полу­чаемые сведения, а количество содержащейся в них информации зависит от того, насколько их нельзя было предвидеть заранее. Статистическая теория информации зародилась на почве анализа передачи сообщении по каналам связи, т. е. в области, прямо не связанной с проблемами управ­ления. Уже позднее обнаружилась возможность обобще­ния теории информации и приложения ее результатов к решению проблем управления. В частности, было по­казано, что всякий орган управления (регулятор) мо­жет рассматриваться как канал связи. При этом его мощность, т. е. способность к выработке эффективных управляющих воздействий, не может превышать его пропускной способности как канала связи с учетом воз­никающих в канале помех. Это утверждение получило название закона необхо­димого разнообразия. Он требует, чтобы при этом принимались во внимание объемы потоков информации и пропускная способность элементов (людей н машин), из которых строится система управления. Если один цен­тральный орган управления не обладает необходимым разнообразием, структура управления становится иерар­хической, многоуровневой. Применение элементов с бо­лее высокой пропускной способностью, например ЭВМ вместо арифмометров, создает предпосылки для сокращения числа уровней, упрощения структуры управления.

Статистическая теория информации оказала большое влияние на глубину познания природы информационных процессов и разработку методов их организации. В то же время, будучи развита прежде всего для решения проблем передачи сообщений, она страдает известной ограниченностью. Основной ее минус в том, что она не принимает во внимание ни содержания сообщений, ни ценности их для конкретных получателей, а неожидан­ность является единственным критерием информатив­ности.

Разумеется, экономисты легко обнаруживают огра­ниченность статистической теории. Они знают, что показатели, вовсе не неожиданные, могут быть весьма содержательными и ценными в зависимости от того, что они отображают и для решения каких задач исполь­зуются. Иначе говоря, неожиданность сообщения - это важный, но не единственный фактор, определяющий его информативность для конкретного получателя.

Другие факторы удается выделить на основе современной теории знаковых систем - семиотики. Предметом семиотики является процесс общения (коммуникации) внутри группы получателей и отправителей сообщений, язык как средство общения. Язык рассматривается при этом как знаковая система, т. е. совокупность знаков и правил их использования для выражения того или иного содержания. Знаком (z) может быть любой материаль­ный объект, если он оказывается элементом так называ­емой знаковой ситуации. Знаковая ситуация, предполагает наличие следующих элементов: 1) совокупности знаков с заданными способами их различения - языка Z, 2) совокупности различимых объек­тов реального мира А: каждый объект а е А обозначается опреде­ленным знаком, например z, т. е. z является обозначением а, который в этом отно­шении есть обозначаемое; 3) совокупности поня­тий S, отражающих реальные объекты в памяти по­лучателей и отправителей информации: каждое поня­тие s е S является отражением определенного объекта, например а, и образует значение (или смысловое значе­ние) обозначающего его знака z, 4) группы получате­лей и отправителей сообщений М: каждый член этой группы т е M получает или отправляет сообщения, вы­раженные в языке Z, причем не только воспринимает, но и оценивает их, соответственно изменяя свое пове­дение.

Отношения между знаками в языке Z взятые неза­висимо от их содержания (значения) и ценности для тех или иных получателей, изучаются особым аспектом се­миотики - синтактикой. Из сказанного выше следует, что статистическая теория информации исследует ин­формацию главным образом в этом аспекте.

Отношения между знаками и обозначаемыми ими объектами (z - а), знаками и их значениями (z - s), а также между объектами и отражающими их поняти­ями - s) образуют предмет другого аспекта семио­тики - семантики. Семантика изучает содержание со­общений - то, что упускается из виду теорией информации. Содержанием сообщения является знание - упорядоченное определенным образом отражение в понятиях, суждениях и других построенных из понятий образах объектов и процессов реального мира. Чтобы воспринять содержание сообщения, получатель сам должен распола­гать определенным запасом знаний. Последний в семио­тике и информатике называют тезаурусом. Восприятие содержания знака состоит в том, что из тезауруса долж­но быть вызвано понятие, являющееся его значением. Если значение знака не будет установлено, знак не доставит получателю никакой информации, каким бы не­ожиданным он ни был.

Отношения между знаками и их получателями (z - m) в плане оценки и влияния их на поведение последних изучаются еще одним аспектом семиотики - прагматикой. Прагматика занимается ценностью сообщений в связи с теми задачами, которые решает их получатель в процессе своей практической деятельности. Чтобы оценить сообщение, его вначале надо принять (по физи­ческому каналу связи) и понять (с помощью тезау­руса). Это означает, что прагматический аспект иссле­дования информации является·наиболее конкретным, учи­тывающим и синтаксические, и семантические отношения между знаками.

. Рассмотрим процесс восприятия сообщения в целом. Вначале сообщение, представ­ленное упорядоченной последовательностью знаков передается по физическому каналу связи и принимается. Качество приема зависит от физического шума в канале и приемнике, от пропускной способности последнего. В этом смысле можно говорить, что при восприятии сообщение проходят физический фильтр. То, что прошло через него, можно считать информацией синтаксической или, статистической, т. е. информацией в смысле клас­сической теории.

Далее эта информация должна быть понята, усвоена получателем. Для, этого сообщение должно пройти теза­урус (тезаурус в переводе с латинского языка означает сокровище, сейчас этим термином чаще всего обозначают систематиче­ский словарь понятий, в котором фиксируются как сами понятия, так и постоянные, не зависящие от контекста, отношения между ними, например классификационные), играющий роль семантического фильтра, отсеивающего семантический шум. Последний может возникнуть, например, в силу того, что в тезаурусе получателя отсутствуют понятия, являющиеся значениями знаков сообщения. В этом случае говорят, что тезаурус и сообщение не имеют общих точек, не пересекаются. Возмо­жен другой случай, когда все содержание сообщения уже имеется в тезаурусе, включено в него. Тогда полу­чатель опять же не получит никакой информации, не узнает ничего нового, и то, что даже понято им, тоже можно считать семантическим шумом. Советские ученые Ю. Шрейдер и И.Грекова предложили считать информацией ту часть содержания сообщения, которая состав­ляет приращение тезауруса получателя. Оно образуется тогда, когда, с одной стороны, тезаурус получателя и содержание сообщения имеют достаточное количество общих точек, чтобы было возможным понимание, а с другой - в сообщении содержатся сведения, новые для получателя. Их восприятие обеспечивается зафиксированными в тезаурусе ассоциативными связями между по­нятиями: благодаря им новым понятиям находится в памяти место, они пристраиваются к тезаурусу, увязы­ваются с другими понятиями.

Для данного получателя сообще­ние содержит только семантический шум и тогда, когда оно не имеет общих точек с тезаурусом, и в случае пол­ного совпадения с ним. При оптимальной степени пере­сечения сообщения и тезауруса достигается максималь­ное приращение тезауруса, т. е. из сообщения извле­кается максимум информации.

Такую информацию можно назвать семантической. Она не только принята, но и понята получателем. Но это не все. Содержание сообщения может быть приня­то, понятно, и все же не исключено, что для конкретного получателя оно не доставит информации, если он не найдет в нем нечто полезное для решения стоящих перед ним задач, если он не настроен на восприятие и исполь­зование его. Содержание сообщения должно быть еще оценено. Эту функцию выполняет третий, прагматический фильтр. Сведения, которые бесполезны для реше­ния актуальных задач, отсекаются им как прагматиче­ский шум. И только те, которые считаются полезными с этой точки зрения, оцениваются как информация. Ее можно было бы назвать прагматической. Однако следует иметь в виду, что в практике управления и в общении между людьми вообще только эту информацию в конеч­ном счете и считают информацией. Статистическая и се­мантическая информация может считаться информацией только в определенных частных случаях, когда от оцен­ки полезности сообщений можно отвлечься. При изучении передачи сообщений по каналам связи, например, можно отвлечься и от содержания, и от ценности их. В оперативном управлении неожиданность (вероят­ность) сообщения ценится так высоко, что прочие фак­торы тоже можно оставить в стороне, хотя они предпо­лагаются. В процессе обучения новые знания, расширяю­щие тезаурус обучаемого, приобретают самостоятельную ценность независимо- от того, будут или не будут они использоваться в дальнейшем. Это тот случай, когда можно отвлечься от ценности получаемых знаний. Но в практической деятельности чаще всего именно оценка дает окончательное заключение относительно того, какие сведения можно считать информацией.

Таким образом, под информацией условимся понимать новые знания, принятые, понятые и оцененные как полезные для решения тех или иных задач. Информа­ция - это то, что доведено до получателя через тройной фильтр механизма восприятия.

Единицы измерения информации

Для рациональной организации системы информации и оценки ее состояния крайне важно уметь измерять ко­личество информации. Прагматическую информацию мы пока измерять не умеем. Во всяком случае, пред­ложенные способы ее измерения пока нельзя назвать ни адекватными, ни практичными. На практике ограни­чиваются, по существу, измерением либо объема данных, либо количества информации в статистическом смысле.

Объем данных чаще всего измеряется числом доку­ментов, а также цифровых и алфавитных символов. По­скольку документы весьма различны по размеру, в ка­честве единицы измерения объема данных их можно использовать лишь при грубых оценках или при усло­вии, что подсчет ведется для, массива документов одной формы. Символы в этом отношении более удобны. Од­нако, являясь знаками, они, как правило, не имеют соб­ственного значения и не являются смысловыми едини­цами. Таковыми можно было бы считать высказывания (или отдельные предложения) текстов, выражающие законченную мысль. Но подсчет таких единиц содержа­ния затруднен из-за различий в структуре и объемах. Есть, однако, один тип высказываний, весьма распро­страненных в управлении, подсчет которых не составляет труда. Это элементы количественных данных - по­казатели.

Существуют два определения показателя. Согласно первому определению, принятому среди экономистов, плановиков, статистиков, под показателем понимается качественно определенная переменная величина, характеризующая тот или иной объект, которой может соответствовать множество количественных значений. Такой показатель имеет определенную методологию измерения или алгоритм расчета. Таковы, например, показатели валовой продукции, среднесписочной числен­ности работающих, среднегодовой стоимости основных фондов. Понятно, что при таком определении показатель не может быть единицей измерения объема данных.

Согласно второму определению, принятому в теории автоматизированной обработки данных, под, показате­лем понимается высказывание, содержащее количественную характеристику отображаемого объекта. Такое высказывание имеет определенную структуру. В его со­став входит единственное количественное значение, на­зываемое иногда основанием, а также набор идентифицирующих его содержательных (качественных) признаков, который удобно назвать идентификатором показателя. Идентификатор показателя в свою очередь делится на две части - наименование показателя, объ­единяющее основные признаки, выражающие его основ­ной экономический смысл, и дополнение, включающее дополнительные признаки. Последние позволяют одно­значно идентифицировать его количественное значение во времени и пространстве. Оказывается, наименование показателя точно соответствует первому из приведенных определений. Например, выражение вида: «Валовая про­дукция промышленности СССР в 1970 г. в млрд. руб. в оптовых ценах предприятий фактически - 374.3» есть показатель, отвечающий второму определению, но вхо­дящее в его идентификатор наименование показателя - валовая продукция, есть не что иное, как показатель в экономическом понимании.

Таким образом, оба определения показателя взаимо­связаны, не противоречат друг другу и оба должны использоваться, поскольку имеют разное назначение. Оба определения можно обобщить, если понимать под пока­зателями вообще количественные данные. Чтобы раз­личать их, условимся называть элементарным показа­тель, соответствующий второму определению. Одно из его достоинств заключается в том, что он является до­ступной для подсчетов и притом смысловой единицей измерения объема количественных данных. Достаточ­но подсчитать число количественных значений или за­полненных графоклеток в документах табличной формы.

Производя такого рода подсчеты, можно обнаружить зависимость между объемом данных в алфавитно-ци­фровых символах и в таких смысловых единицах, каки­ми являются элементарные показатели. Оказывается, что чем больше размер таблицы, тем меньше символов тре­буется для выражения содержания одного элементар­ного показателя.

Общепринятой единицей измерения информации в статистическом смысле является неопределенность, устраняемая выбором одного из двух равновероятных исходов, так называемая двоичная единица, или бит. Поскольку в качестве меры неопределен­ности принята логарифмическая функция, выбор единицы измерения сводится к выбору основания лога­рифма. Измерение количества информации в битах оз­начает, что единицей измерения является логарифм при основании 2.

Понятно, что количество битов не позволяет судить ни о содержательности сообщения, ни о его ценности для получателя, хотя нельзя утверждать, что мера стати­стической информации не имеет никакой связи с семан­тикой или прагматикой. Однако многочисленные по­пытки построить меру семантической и прагматической информации пока не увенчались успехом. Для измере­ния содержательности сообщений мы должны были бы научиться измерять приращение тезауруса, а стало быть, знать и объем тезауруса конкретного получателя. Пока это недоступно для нас.

Экономическая информация и ее классификация

В управлении народным хозяйством используются различные виды информации, в том числе и экономиче­ская. Определить экономическую информацию, устано­вить ее особенности можно, только рассмотрев вначале более общее понятие-информацию для управления народным хозяйством, с которой экономическую инфор­мацию часто отождествляют. Она может классифициро­ваться по двум группам признаков: 1) организационным; 2) содержательным (семантическим).

Классификация по организационным признакам распространяется и на эконономическую информацию, хотя не является специфичной для нее. По отношению к данной системе информация делится на внешнюю и внутреннюю, а по отношению к ее системе управления на входную и выходную. Входная внутренняя информа­ция представляет информацию первичную, получаемую в результате прямого наблюдения, регистрации данных о состоянии и действиях управляемого объекта.

Важное значение имеет классификация информации по признаку отношения к операциям обработки данных в системе управления, предложенная М. А. Королевым. Она представлена на рис. 4 [4, с. 99].

Для изучения потоков информации имеет значение ее деление по направлению движения. По этому признаку входная и выходная информация делится на гори­зонтальную, связывающую органы управления одного уровня, и вертикальную - связывающую органы разных уровней структуры управления. Последняя делится на восходящую, направляемую с нижних уровней на верх­ние, и нисходящую, направляемую сверху вниз. По назначению относительно данного органа управ­ления различается информация осведомляющая и управляющая. Первая используется для обоснования решений, вторая порождается в процессе принятия решений и направляется к объекту управления для ис­полнения.

По функциям управления информация делится в за­висимости от того, какая функция управления ее вырабатывает. По этому признаку выделяется плановая информация, вырабатываемая планированием, норматив­ная, прогнозная, учетная, .контрольная, аналити­ческая и т. д.

Наконец, по степени организации различается инфор­мация систематизированная и несистематизированная. Под систематизированной понимается информация, выработка и передача которой регламентируется или по содержанию, или по формам представления, или по вре­менному режиму. Несистематизированная информация не регламентирована.

Для организации информационных процессов важное значение имеет также деление информации по длительности периода, в течение которого она сохраняет свою актуальность и используется в принятии решений. По существу, с этим признаком связано деление информа­ции на постоянную, условно-постоянную и переменную. Однако, как показал Е. З. Майминас, это деление носит относительный характер: для предприятия нормативы затрат труда и материалов - условно - посто­янная информация, а для народнохозяйственного пла­нирования - переменная. Для этого признака полезно было бы выделить более устойчивые группировки, на­пример, такие:

1) теоретическая (научная) - результаты фундамен­тальных и прикладных научных исследований в различных областях, находящие широкое применение в производстве и управлении;

2) стратегическая - сохраняющая актуальность в течение длительных периодов (10 - 15 лет). К ней относятся долгосрочные планы и прогнозы, фактические дан­ные о медленно изменяющихся объектах, проектно-кон­структорская информация и т. п.;

  1. тактическая ( конъюнктурная) информация - с периодом актуальности в пределах от квартала до 2-3 лет;

  2. оперативная информация - сохраняющая актуаль­ность в пределах цикла оперативного управления.

Рассмотрим теперь классификацию информации для управления народным хозяйством по содержательным (семантическим) признакам. Эти признаки делят инфор­мацию по отображаемым ею объектам и процессам, их свойствам и отношениям. При, этом воспроизводятся классификации самих объектов отражения. Заметим, что в этом состоит особенность семантических признаков. Организационные признаки относятся к самой информа­ции и могут стать семантическими, но только в том слу­чае, когда объектом отражения становится сама инфор­мация, т. е. когда собирается и анализируется информа­ция об информации (метаинформация).

По отображаемым объектам информация может быть разделена, например, на информацию о населении (де­мографическую), о трудовых ресурсах, о природе и при­родных ресурсах, о продукции и услугах, О средствах производства, финансах и т. д. Поскольку существуют весьма глубокие классификации этих объектов, они бу­дут одновременно классификациями информации о них.

Например, средства производства делятся на средства труда и предметы труда (по назначению), на основные и оборотные средства (по форме размещения). Соответ­ственно можно группировать и информацию.

Однако различные объекты могут находиться в раз­ных отношениях между собой и соответственно в процес­се изучения и управления рассматриваться в разных аспектах. Например, явления природы могут рассматриваться исключительно в плане присущих им внутренних закономерностей. Такой подход к ним свойствен есте­ственным наукам. Но они могут рассматриваться и в плане их производственно - технологического использова­ния как природных ресурсов и в плане возникающих в связи с ними экономических и социальных отношений между людьми. Аспект рассмотрения оказывается чрез­вычайно важным с точки зрения содержания информа­ции. Только сего учетом можно более точно определить, что такое экономическая информация.

По признаку отражаемых отношений между объек­тами модно выделить следующие виды информации:

1) естественнонаучную - об отношениях между при­родными объектами как таковыми;

  1. технико-технологическую - об отношениях меж­ду предметами природы, выделяемыми в связи с техни­кой и технологией их хозяйственного использования; это информация о производительных силах общества и технико - технологических связях между их элементами;

  2. экономическую - об отношениях между людьми по поводу производства, распределения, обмена и по­требления общественного продукта; это информация о производственных (экономических) отношениях

  3. социально-политическую - о прочих социальных, политических, идеологических, морально-этических отно­шениях между людьми, входящих в понятие обществен­ной надстройки.

Все выделенные виды информации используются в .управлении народным хозяйством, однако это, как мы видим, не означает, что их можно свести только к эконо­мической информации.

В то же время, поскольку экономическая система определяется по - разному - как совокупность производ­ственных отношений или как совокупность производ­ственных отношений с производительными силами, - в более широкое понятие экономической информации включают обычно и экономическую информацию в опре­деленном выше узком смысле, и технико-технологиче­скую информацию. В практике управления между ними, хотя и не всегда четко, но все же проводят различие. Так, в планировании н статистике выделяют так назы­ваемые технико-экономические или технико-производ­ственные показатели.

Кроме перечисленных общих признаков, экономиче­ская информация классифицируется также по ряду специфических. В числе последних следует отметить деление по признаку отображаемой фазы или процесса воспроизводства (информация о производстве, обращении, распределении, потреблении), а также по отраслям на­родного хозяйства (промышленность, сельское хозяйство, строительство, транспорт и т. д.), по территориальным единицам, по организационно-хозяйственным единицам (министерствам, ведомствам, предприятиям и организа­циям и т. п.).

Поскольку классификация экономической информа­ции по семантическим признакам воспроизводит класси­фикации отражаемых в ней объектов, процессов и отно­шений, а последние фиксируют логические отношения между соответствующими понятиями и терминами, яв­ляющимися их знаками в языке управления народным хозяйством, взаимосвязанная совокупность таких классификаций будет представлять не что иное, как тезаурус экономической информации. Принадлежность конкрет­ного сообщения к тому или иному классу определяется при этом тем, к каким классификациям относятся тер­мины (и образующие их значения понятия), из которых составлено сообщение. Например, в сообщении содер­жатся плановые показатели производства продукции промышленности СССР. Стало быть, это сообщение от­носится к группировке, образуемой пересечением (соче­танием позиций) из классификаций экономической информации: 1) по признаку отображаемого объекта (продукция); 2)фазы или процесса воспроизводства (производство); 3) отрасли (промышленность); 4) тер­ритории (СССР); 5) функции управления (планирова­ние). Это обстоятельство, как мы увидим, имеет важное значение для организации хранения и поиска данных. Классификация экономической информации, таким образом, оказывается далеко не теоретическим упражнением.

Соседние файлы в папке Kolokvium