Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Bilety_po_informatike_shpargalki.docx
Скачиваний:
44
Добавлен:
22.02.2015
Размер:
1.5 Mб
Скачать

Раздел 2 (Лекции 2-3)

Термин Информация

Термин информация имеет множество определений. В «Энциклопедии кибернетики» читаем: «информация ( лат. informatio — разъяснение, изложение, осведомленность ) — одно из наиболее общих понятий науки, обозначающее некоторые сведения, совокупность каких-либо данных, знаний».

«Информация» в широком смысле—отражение реального мира; в узком смысле «информация» — это любые сведения, являющиеся объектом хранения, передачи и преобразования.

Информация – это сведения об объектах и явлениях окружающей среды, их параметрах, свойствах и состоянии, которые уменьшают имеющуюся о них степень неопределенности, неполноты знаний.

С практической точки зрения информация всегда представляется в виде сообщения.

Термин данные

Очень широко используется еще один термин: данные (лат. data). Этот термин применяется к информации, представленной в виде, позволяющем хранить, передавать или обрабатывать ее с помощью технических средств.

Поэтому наряду с терминами ввод информации, обработка информации, хранение информации, поиск информации используются термины ввод данных, обработка данных, хранение данных и т. п.

Общая схема передачи информации

Источник сообщений -> Кодирующее устройство -> Канал связи -> Декодирующее устройство -> Получатель сообщений

Информационное сообщение

Сообщение от источника к получателю (приемнику) передается в материально-энергетической форме (электрический, световой, звуковой сигналы и т. д.). Человек воспринимает сообщения посредством органов чувств.

Приемники информации в технике воспринимают сообщения с помощью различной измерительной и регистрирующей аппаратуры.

В обоих случаях с приемом информации связано изменение во времени какой-либо величины, характеризующей состояние приемника.

Информационное сообщение представим функцией х(t)

Функция х(t), характеризует изменение во времени материально-энергетических параметров физической среды, в которой осуществляются информационные процессы.

Функция х(t) принимает любые вещественные значения в диапазоне изменения времени (t).

Аналоговая и дискретная информация

Если функция х(t) непрерывна, то имеет место непрерывная или аналоговая информация, источником которой обычно являются различные природные объекты (например, температура, давление и влажность воздуха), объекты технологических производственных процессов (например, нейтронный поток в активной зоне, давление и температура теплоносителя в контурах ядерного реактора) и др.

Если функция х(t) дискретна, то информационные сообщения, используемые человеком, имеют характер дискретных сообщений (например, сигналы тревоги, передаваемые посредством световых и звуковых сообщений, языковые сообщения, передаваемые в письменном виде или с помощью звуковых сигналов; сообщения, передаваемые с помощью жестов, и др.).

Термин Вычислительная машина (Компьютер)

В современном мире информация обрабатывается на вычислительных машинах. Поэтому информатика тесно связана с инструментарием — вычислительной машиной (ВМ).

Computer — устройство преобразования информации посредством выполнения управляемой программой последовательности операций.

Синоним компьютера — вычислительная машина, чаще электронная вычислительная машина (ЭВМ).

Классификация вычислительных машин

АВМ и ЦВМ

Аналоговая вычислительная машина (АВМ) — это машина, оперирующая информацией, представленной в виде непрерывных изменений некоторых физических величин.

При этом в качестве физических переменных используются сила тока электрической цепи, угол поворота вала, скорость и ускорение движения тела и т. п.

Используя тот факт, что многие явления в природе математически описываются одними и теми же уравнениями, АВМ позволяют с помощью одного физического процесса моделировать различные процессы.

Цифровая вычислительная машина (ЦВМ) — машина, оперирующая информацией, представленной в дискретном виде.

В настоящее время разработаны методы численного решения многих видов уравнений, что дало возможность решать на ЦВМ различные уравнения и задачи с помощью набора простых арифметических и логических операций.

Поэтому, если АВМ обычно предназначаются для решения определенного класса задач, т.е. являются специализированными, то ЦВМ, как правило, являются универсальным вычислительным средством.

Алфавитный способ Представление дискретной информации в ЭВМ

Алфавитный способ основан на использовании фиксированного конечного набора символов любой природы, называемого алфавитом.

Примерами алфавитов могут служить алфавиты естественных человеческих языков, совокупность десятичных цифр, любая другая упорядоченность знаков, предназначенная для образования и передачи сообщений.

Символы из набора алфавита называются буквами, а любая конечная последовательность букв — словом в этом алфавите. При этом не требуется, чтобы слово обязательно имело языковое смысловое значение.

Процессы кодирования и декодирования информации

Все процессы, происходящие в вычислительной системе, связаны непосредственно с различными физическими носителями информационных сообщений, а все узлы и блоки этой системы являются физической сферой, в которой осуществляются информационные процессы.

Процесс преобразования информации часто требует представлять буквы одного алфавита средствами (буквами, словами) другого алфавита. Такое представление называется кодированием.

Процесс обратного преобразования информации относительно ранее выполненного кодирования называется декодированием.

Классификация информации

Рассмотрим следующий перечень: генетическая информация; геологическая информация; синоптическая информация; ложная информация (дезинформация); полная информация; экономическая информация; техническая информация и т. д.

Действительно, что в этом перечне приведены не все виды информации, кроме того, от этого перечня мало проку.

Этот перечень не систематизирован. Для того чтобы классификация по видам была полезной, она должна быть основана на некоторой системе. Обычно в качестве базы для классификации используется то или иное свойство (может быть набор свойств) объектов.

Свойства информации: внутренние и внешние

Как правило, свойства объектов можно разделить на два больших класса: внешние и внутренние свойства.

Внешние свойства — это свойства, характеризующие поведение объекта при взаимодействии с другими объектами.

Внутренние свойства — это свойства, органически присущие объекту. Они обычно «скрыты» от изучающего объект и проявляют себя косвенным образом при взаимодействии данного объекта с другими.

Качество информации

Качество информации — обобщённая положительная характеристика информации, отражающая степень её полезности для потребителя.

Показатель качества — одно из важных положительных свойств информации (с позиции потребителя).

Чаще всего рассматривают показатели качества, которые можно выразить числом, и такие показатели являются количественными характеристиками положительных свойств информации.

При этом, любое отрицательное свойство может быть заменено обратным ему, положительным

Показатели качества

Релевантность — способность информации соответствовать нуждам (запросам) потребителя.

Полнота — свойство информации исчерпывающе (для данного потребителя) характеризовать отображаемый объект или процесс.

Своевременность — способность информации соответствовать нуждам потребителя в нужный момент времени.

Достоверность — свойство информации не иметь скрытых ошибок.

Набор важнейших показателей качества информации

Доступность — свойство информации, характеризующее возможность ее получения данным потребителем.

Защищённость — свойство, характеризующее невозможность несанкционированного использования или изменения информации.

Эргономичность — свойство, характеризующее удобство формы или объема информации с точки зрения данного потребителя.

Конфиденциальность – свойство информации быть известной только допущенным и прошедшим проверку (авторизацию) субъектам (пользователям, процессам, программам)

Адекватность информации

Адекватность – это свойство информации однозначно соответствовать отображаемому объекту или явлению.

Это вторая группа внешних свойств информации с точки зрения: информация – отображаемый объект.

Адекватность также является для потребителя внутренним свойством информации, проявляющим себя через релевантность и достоверность

Внутренние свойства информации

Среди внутренних свойств информации важнейшими являются два:

объем (количество) информации и её внутренняя организация – структура.

Об объёме и количестве информации речь пойдёт позднее, а по способу ее внутренней организации информацию делят на две группы:

1. Данные или простой, логически неупорядоченный набор сведений.

2. Логически упорядоченные, организованные наборы данных.

Упорядоченность достигается наложением на данные некоторой структуры (отсюда часто используемый термин — структура данных).

Знания и их свойства

Во второй группе выделяют особым образом организованную информацию — знания.

Знания (в отличие от данных) представляют информацию не о каком-то единичном и конкретном факте, а о том, как устроены все факты определённого типа.

Знания обладают свойствами:

Внутренняя интерпретируемость

Структурированность

Связанность

Активность Все эти свойства знаний в конечном итоге обеспечивают возможность моделировать рассуждения человека в системах искусственного интеллекта.

Методы и модели оценки количества информации

Как и для характеристик вещества (вспомним массу, заряд, объем и т.д.), так и для характеристик информации имеются единицы измерения, что позволяет некоторой порции информации приписывать числа — количественные характеристики информации.

Способы измерения информации

На сегодняшний день наиболее известны следующие способы измерения информации:

Объёмный (самый простой и грубый),

Энтропийный (принят в теории информации и кодировании),

Алгоритмический (оценка сложности и размера соответствующей программы).

Объёмный способ измерения информации

Объем информации в сообщении — это количество символов в сообщении.

Поскольку, например, одно и то же число может быть записано многими разными способами (с использованием разных алфавитов), то этот способ чувствителен к форме представления (записи) сообщения.

Единицы измерения объёма

В вычислительной технике вся обрабатываемая и хранимая информация представлена в двоичной форме (с использованием алфавита, состоящего всего из двух символов 0 и 1).

Такая стандартизация позволила ввести две стандартные единицы измерения: бит и байт.

Бит — количество информации, которое может помещаться в один элемент памяти.

Байт — это восемь бит.

Энтропийный способ измерения количества информации

Этот способ измерения исходит из следующей модели. Получатель информации (сообщения) имеет определённые представления о возможных наступлениях некоторых событий. Эти представления в общем случае недостоверны и выражаются вероятностями Pi, с которыми он ожидает то или иное событие.

Общая мера неопределённости (энтропия) характеризуется некоторой математической зависимостью от совокупности этих вероятностей.

Количество информации в сообщении определяется тем, насколько уменьшится эта мера неопределённости после получения сообщения.

Формула Шеннона

Количество информации в сообщении, состоящем из N символов H= -  Pi log2 Pi , где i изменяется от 1 до N,

Pi - это вероятность i-ого символа.

Pi = 1/N при равновероятных символах.

H=log2 N, где N - число возможных равновероятных символов в сообщении.

Формула Хартли

Используется для оценки количества информации H в сообщении, передаваемого по каналу связи числовым кодом.

Пусть m – основание системы счисления (число букв алфавита)

Пусть n – число разрядов в сообщении.

Тогда N = mn - число всевозможных кодовых комбинаций сообщения.

При равновероятном появлении любой кодовой комбинации количество информации, приобретённое получателем:

H=log2 N = log2 mn = n log2 m

Информативность сообщения

При условии полного априорного незнания получателем сообщения, передаваемого по каналу связи двоичным кодом, количество информации равно количеству символов в сообщении (числу разрядов), т.е. объёмный (V) и энтропийный (H) способ измерения дают один и тот же результат: H=V=n, бит

При наличии некоторой априорной информации, т.е. при не равновероятных символах в сообщении, всегда H<V=n.

Kинф = H/V, [0, 1] Для увеличения Kинф разрабатываются методы оптимального кодирования информации.

Алгоритмический способ измерения информации

Этот метод кратко можно охарактеризовать следующими рассуждениями.

Каждый согласится, что слово 0101…01 сложнее слова 00...0, а слово, где 0 и 1 выбираются из эксперимента — бросания монеты (где 0 — герб, 1 — решка), сложнее обоих предыдущих.

Понятие Машины Тьюринга

Так как имеется много разных вычислительных машин и разных языков программирования (разных способов задания алгоритма), то для определенности задаются некоторой конкретной вычислительной машиной, например, абстрактной машиной Тьюринга.

А предполагаемая количественная характеристика — сложность слова (сообщения) определяется как минимальное число внутренних состояний машины Тьюринга, требующиеся для его воспроизведения.

Основные понятия теории алгоритмов

В информатике алгоритмы рассматриваются в двух аспектах: теоретическом и прагматическом, тесно связанным с программированием.

Теория алгоритмов — раздел математики, изучающий общие свойства алгоритмов.

Понятие «алгоритм» сформировалось в математике в 20-х годах XX в. Началом систематической разработки теории алгоритмов можно считать 1936 г. и связывают это начало с публикацией работы А.А. Черча.

Алгоритмическая модель и её составляющие

Составляющими такой модели должны быть конкретный набор элементарных шагов, способы определения следующего шага. Каждый шаг должен быть элементарным и выполнимым, чтобы алгоритм понимался однозначно.

От модели также требуется простота и универсальность. Универсальность необходима для того, чтобы модель позволяла описать любой алгоритм.

Требование простоты важно для того, чтобы выделить необходимые элементы и свойства алгоритма и облегчить доказательства общих утверждений об этих свойствах.

Три основных класса алгоритмических моделей

Первый класс моделей основан на арифметизации алгоритмов.

Второй класс моделей основан на идее машинизации алгоритмов: он должен быть представлен так, чтобы его могла выполнять вычислительная машина.

Третий класс моделей алгоритмов оперирует конкретными алфавитами, здесь наиболее известная алгоритмическая модель— нормальные алгоритмы Маркова.

Первый. Предполагается, что любые данные можно закодировать числами, и как следствие — всякое их преобразование становится в этом случае арифметическим вычислением, алгоритмом в таких моделях является вычисление значения некоторой числовой функции, а его элементарные шаги — арифметические операции.

Последовательность шагов определяется двумя способами. Первый способ — суперпозиция, т.е. подстановка функции в функцию, а второй — рекурсия, т.е. определение значения функции через «ранее» вычисленные значения этой же функции. Функции, которые можно построить из целых чисел и арифметических операций с помощью суперпозиций и рекурсивных определений, называются рекурсивными функциями. Например: n! (n+1)

Второй. Основные составные части машины Тьюринга: (УУ) — управляющее устройство, 1 — лента, 2 - головка; А = {а1... аm} — алфавит машины; Q= {q1 … qn} — множество состояний машины (точнее, головки), среди которых выделяют начальное q1 и конечное qz

Третий. Для нормального алгоритма задается алфавит, над которым он работает, конечное множество допустимых подстановок и правила их применения:

1) проверить возможность подстановок в порядке возрастания их номеров, и если она возможна (левая часть подстановки обнаружена в исходном слове), произвести подстановку (заменив левую часть на правую);

2) если в примененной подстановке имеется символ «!», то преобразования прекращаются, а если нет, то текущее состояние становится исходным и весь процесс начинается заново;

3) если ни одна подстановка не применима, то процесс преобразования завершен.

Описание машины Тьюринга

Машина Тьюринга состоит из трех частей: ленты, головки и управляющего устройства. Лента бесконечна в обе стороны и разбита на ячейки. В каждой ячейке может быть записан только один символ. Отсутствие символа в ячейке обозначается специальным «пустым» символом, например, « ».

Головка всегда располагается над некоторой ячейкой ленты. Она может читать и писать символы, стирать их и перемещаться вдоль ленты как вправо так и влево.

Пример машинной модели (алгоритм сложения)

Пусть m и n неотрицательные целые числа произвольной длины.

Числа представляются счётно-импульсным кодом, т.е. количеством 1, равных m или, соответственно, n.

Необходимо построить алгоритм вычисления m+n.

Зададим алфавит машины Тьюринга:

А = { #,1,0 } , где

# - отсутствие символа в ячейке ленты

1 - символ кода числа

0 – символ разделения двух чисел

Начальная конфигурация q1 a1

Конечная конфигурация a2 qk

Покажем, что число 4 характеризует сложность алгоритма сложения и не зависит от длины входных данных. Для этого запишем набор команд машины Тьюринга и найдем необходимое число внутренних состояний машины.

Команды машины: qiak > qjaldp

q1# > q1# R R – Right

q11 > q11 R

q10 > q21 R

q21 > q21 R

q2# > q3# L L – Left

q31 > q4# S S - Stop

Алгоритмы Маркова

зададим алгоритм преобразования исходного слова «СЛОН» в слово «МУХА» по следующей цепочке:

«СЛОН» —» «СУОН» —> «МУОН» —> «МУХН» —» «МУХА». Используя множество подстановок

1. Я - У 2. Л - У 3. С - М 4. В - Б 5. Р - Т 6. Т - Р! 7. О-Х 8. Н - А

Понятие алгоритмически неразрешимой задачи

Появление точного понятия алгоритма позволило сформулировать алгоритмически не разрешимые проблемы, т.е. задачи, для решения которых невозможно построить алгоритм. Задача называется алгоритмически неразрешимой, если не существует машины Тьюринга (или рекурсивной функции, или нормального алгоритма Маркова), которая её решает. Например, неразрешимой оказалась проблема распознавания эквивалентности алгоритмов: нельзя построить алгоритм, который по любым двум алгоритмам (программам) выяснял бы, вычисляют они одну и ту же функцию или нет. Знание основных неразрешимостей теории алгоритмов необходимо для специалиста по информатике. Оно предостережёт его от увлечения глобальными прожектами всеобщей алгоритмизации точно так же, как знание основных законов физики предостерегает от попыток создания вечного двигателя.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]