- •Isbn 978-5-9765-0098-3 (Флинта) isbn 978-5-02-034597-3 (Наука)
- •1.1.2. Методы воспроизведения и обработки данных
- •1.1.3. Понятие информации
- •1.1.4. Понятие контекстного метода
- •1.2. Данные
- •1.2.2. Операции
- •1.3.2. Классификация прикладных программ
- •1.3.3. Периферийные устройства
- •1.4. Интеллектуальные информационные системы
- •1.4.1. Искусственный интеллект (Artificial Intelligence)
- •1.4.2. Нейронные сети
- •1.4.3. Экспертные системы
- •2. Обзор лингвистических программ
- •2.1.1. Текстовые процессоры
- •2.1.3. Генераторы текстов и «говорящие» программы
- •2.2. Машинный перевод
- •2.2.1. Основные этапы развития машинного перевода
- •2.2.2. Как переводит компьютер
- •2.2.3. Классификация систем
- •2.3. Компьютерная лингвистика: нестандартные применения
- •2.3.1. Определение языка сообщения
- •2.3.2. Взлом шифров
- •2.3.3. Установление авторства
- •2.3.4. Построение роботов-поисковиков и снифферов
- •Заключение
- •Приложение
- •Оглавление
- •1 . Информация. Информационные
- •1.1. Информация 3
- •Информационный обмен, сигналы, данные 3
81*33(075)
81.1-923 В84
■
Рецензент:
И.В. Козина, канд. филол. наук,
доцент кафедры немецкого языка Ярославского госпедун и перс п гея им. К.Д. Ушинского
1. ИНФОРМАЦИЯ. ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ
1 .1. ИНФОРМАЦИЯ
.
Всеволодова А. В.
В84 Компьютерная обработка лингвистических данных : учеб.
пособие/А.В. Всеволодова. — 2-е изд., испр. — М.: Наука : Флин- та, 2007. - 96 с.
ISBN 978-5-9765-0098-3 (Флинта) ISBN 978-5-02-034597-3 (Наука)
В пособии изложен минимум знаний по информатике и информацион ным технологиям, необходимый для изучения данного курса. Наряду с базо- выми понятиями, методами и приемами использования средств вычислитель- ной техники рассмотрены передовые информационные и коммуникационные технологии глобальных компьютерных сетей. Изложены основные направле- ния фундаментальных исследований и коммерческих разработок, находящихся на пересечении лингвистики, методов представления, обработки знаний и са- мых современных информационных технологий. Рассмотрены типичные и спе- цифические приложения компьютерной лингвистики. Значительное место от- водится классификации лингвистических программ, детально описаны их свой- ства и назначение.
Для студентов, аспирантов и преподавателей лингвистических и филологи- ческих факультетов вузов, а также всех интересующихся компьютерной об- работкой лингвистических данных.
8ГЗЗ(О7М 81.1 923
О МУБиНТ (Ярославль), 2005
Isbn 978-5-9765-0098-3 (Флинта) isbn 978-5-02-034597-3 (Наука)
1.1.1. Информационный обмен, сигналы, данные
Материя существует в двух формах: в виде материальных тел и в виде энергетических полей. Поля и тела постоянно взаимо- действуют друг с другом. Этот обмен сопровождается измене-
нием свойств как самих тел, так и окружающих их полей.
Человек – материальный объект, ему свойственно непре-
рывное энергетическое взаимодействие с другими объектами материального мира. В то же время он организм живой природы и обладает непрерывным внутренним обменом веществ. Эти два процесса взаимодействуют. Результат такого взаимодействия мы воспринимаем как информационный обмен (рис. 1).
Рассмотрим пример. Если животное воспринимает окружающую среду как угрожающую, в кровь выделяются специальные вещества, повышающие частоту дыхания, усиливающие сердцебиение и т.д. Иные по содержанию, но похожие по механизму процессы происходят при успокоении. Это информационный обмен, инициированный внешней средой.
Но информационный обмен не обязательно инициируется только внешней средой. Человеку достаточно представить что-либо. На этом основаны механизмы воспоминания, воображения, логического мышления и другие, т.е. в основе логического мышления и творчества тоже лежит информационный обмен.
Информационный обмен развивается в виде информационных процессов. Если проследить информационный процесс от начала до конца, то на отдельных его этапах можно и не увидеть объектов живой природы, но в его начале или в конце объект живой природы присутствует обязательно. Это свойство отдельных этапов информационного процесса обходиться без объектов живой природы ныне широко используется в информационных технологиях. Оно лежит в основе функционирования автоматических систем обработки информации.
Любые изменения, происходящие во внутренней структуре вещества или в энергетических полях, сопровождаются образованием сигналов. Они обладают способностью распространяться во времени и пространстве. Например, солнечный свет — это сигналы, возникающие в результате термоядерных реакций, а сейсмограф регистрирует результаты толчков Земли.
Распространение сигналов в пространстве всегда завершается взаимодействием с веществом физических тел. Такое взаимодействие в информатике рассматривается как регистрация сигналов. В качестве примеров можно привести следующие взаимодействия. Световые сигналы вызывают химические изменения в составе вещества в растительных организмах (фотосинтез). Изменения магнитного поля могут быть зарегистрированы на ферромагнитном покрытии. На этом основана звукозапись на магнитной ленте.
4
Информатика не изучает природу сигналов — ее интересует факт их регистрации. Результат регистрации сигналов информатика рассматривает как данные. Если сигнал зарегистрирован четко и легко различим на фоне регистрации побочных сигналов, то он может стать источником получения информации о событиях, которые имели место, или источником информации о предполагаемом событии. Таким образом, в информатике данные — это зарегистрированные сигналы.