- •О.М. Топоркова информационные технологии и системы
- •Введение
- •Глава 1. Производство. Информация. Общество
- •1.1. Информационный характер процесса управления
- •1.2. Элементы субъекта управления и функции управления
- •1.3. Уровни управления и информация
- •1.4. Превращение информации в ресурс общества
- •Глава 2. Структура информационного процесса
- •2.1. Формирование данных
- •2.2. Передача данных
- •2.3. Обработка данных
- •2.4. Хранение данных
- •2.4.1. Оценка данных
- •2.4.2. Защита данных
- •2.4.2.1. Замки и ключи
- •2.4.2.2. Таблицы управления доступом
- •2.4.2.3. Протоколирование и аудит
- •2.4.2.4. Экранирование
- •2.4.2.5. Криптография
- •2.4.2.6. Обеспечение достоверности данных
- •2.4.2.7. Управление параллелизмом
- •2.4.2.8. Восстановление данных
- •Глава 3. Знания как вид информационного ресурса4
- •3.1. Виды знаний
- •3.2. Теоретические аспекты извлечения знаний
- •3.2.1. Психологический аспект
- •3.2.1.1. Контактный слой
- •3.2.1.2. Процедурный слой
- •3.2.1.3. Когнитивный слой
- •3.2.2. Лингвистический аспект
- •3.2.2.1.Общий код
- •3.2.2.2. Понятийная структура
- •3.2.2.3. Словарь пользователя
- •3.2.3. Гносеологический аспект
- •3.3. Методы извлечения знаний
- •3.3.1. Пассивные методы
- •3.3.1.1. Наблюдения
- •3.3.1.2. Мысли вслух
- •3.3.1.3. Лекции
- •3.3.2. Активные методы
- •3.3.2.1. Анкетирование
- •3.3.2.2. Интервью
- •3.3.2.3. Свободный диалог
- •3.3.2.4. Деловые игры
- •3.3.2.5. Круглый стол
- •3.3.2.6. Мозговой штурм
- •3.3.3. Текстологические методы
- •Глава 4. Понятия информационной технологии и информационной системы
- •4.1. Понятие и эволюция информационной технологии в производстве
- •4.2. Характеристика информационной технологии как системы
- •4.3. Структура базовой информационной технологии
- •4.3.1. Концептуальный уровень базовой информационной технологии
- •4.3.2. Логический уровень базовой информационной технологии
- •4.3.3. Физический уровень базовой информационной технологии
- •4.4. Понятие и эволюция информационных систем
- •4.5. Классификация информационных систем
- •Глава 5. Новые информационные технологии
- •5.1. Представление знаний в компьютере
- •5.1.1. Продукционная модель
- •5.1.2. Сетевая модель
- •Полная семья
- •5.1.3. Фреймовая модель
- •5.1.4. Логическая модель
- •5.2. Интеллектуальные информационно-поисковые системы
- •5.2.1. Морфологический анализ
- •5.2.2. Синтаксический анализ
- •5.2.3. Семантический анализ
- •5.3. Расчетно-логические системы
- •5.4. Экспертные системы
- •Глава 6. Организация интерфейса пользователя в информационных технологиях и системах
- •6.1. Типы диалогов
- •6.2. Эргономичность интерфейса
- •Глава 7. Современные тенденции в области информационных технологий и систем
- •7.1. Км-технологии9
- •7.2. Cals-технологии
- •7.3. Erp-технологии
- •7.4. Scm-технологии
- •7.5. Crm-технологии
- •7.6. WorkFlow-технологии
- •7.7. Ит-стратегия предприятия
- •7.7.1. Источники экономической эффективности
- •7.7.2. Выбор системы и команды внедрения
- •7.7.3. Внедрение системы
- •7.8. Itil-технологии
- •7.9. Отечественный рынок решений в области информационных технологий
- •7.9.1. Renaissance
- •7.9.2. Axapta
- •7.9.3. Шереметьево-Карго
- •7.9.4. Eli Lilly
- •Список литературы
- •Оглавление
5.2. Интеллектуальные информационно-поисковые системы
Основа таких систем – лингвистический процессор, осуществляющий анализ фраз естественного языка. Его структура представляется схемой рисунка 5.9.
Рисунок 5.9 - Схема лингвистического процессора
5.2.1. Морфологический анализ
Текст запроса разбивается на словоформы – отрезки текста между пробелами, исключая знаки препинания. Затем каждой словоформе приписывается так называемая морфологическая информация - грамматическое значение словоформы, например, часть речи, число, падеж и т.д. Выявление этой информации возможно за счет выделения основ и аффиксов словоформ.
Аффиксы – это части слова за исключением корня (основы). Могут быть: префиксы (перед корнем, например, приставки), постфиксы,, или флексии (после корня, например, суффиксы и окончания), интерфиксы (между корнями в сложных словах). Аффиксы делятся на словообразующие (суффиксы), например, студен – ческий, и словоизменительные (окончания), например, студент–а, студент –ом. Основа – это слово с отсеченными словообразующими и словоизменительными аффиксами. Морфологическая информация приписывается по значению словоизменительных аффиксов.
Этапы морфологического анализа:
поиск словоформы в словаре основ. Если словоформа найдена, ей приписывается соответствующая морфологическая информация, и морфологический анализ для нее заканчивается. Иначе – второй этап;
определение морфологического типа и части речи. Используется таблица словоизменительных аффиксов (таблица аффиксов на рисунке 5.9) для отсечения от словоформы предполагаемых аффиксов;
получение списка гипотетических основ и значений грамматических категорий. Здесь уточняется часть речи и морфологический тип с помощью вспомогательной таблицы суффиксов и квазисуффиксов - исходов основ (на рисунке 5.9 – таблица аффиксов).
Например, выполним морфологический анализ предложения
СТУДЕНТОМ РАССМОТРЕНЫ ВОПРОСЫ МЕЖДУНАРОДНЫХ ОТНОШЕНИЙ?
при условии, что данные словоформы отсутствуют в словаре основ, т.е. для них выполняются оставшиеся два этапа морфологического анализа.
Для выполнения первого шага используем фрагмент таблицы словоизменительных аффиксов (таблица 5.1).
Таблица словоизменительных аффиксов
Таблица 5.1
аффикс |
часть речи |
морфологические типы7 |
род |
число |
падеж |
одушевленность |
пассивность |
примеры |
Ы |
существительное |
1,2,7 |
м |
мн. |
им. |
любая |
- |
месяцы |
существительное |
13,18 |
ж |
мн. |
им. |
любая |
- |
улицы | |
существительное |
13,18 |
ж |
ед. |
род. |
любая |
- |
карты | |
прилагательное |
9 |
любой |
мн. |
им. вин. |
любая |
- |
отцовы | |
ОМ |
существительное |
11 |
м ср |
ед. |
твор. |
любая |
- |
столом |
Й |
существительное |
8,9 |
м |
ед. |
им. |
любая |
- |
герой |
существительное |
19,20 |
ж |
мн. |
род. |
любая |
- |
линий | |
существительное |
27 |
сред |
мн. |
род. |
любая |
- |
зданий | |
ЫХ |
прилагательное |
1,5,6,9 |
любой |
мн. |
вин. род. |
неодушевленный |
- |
грузовых |
ИЙ |
прилагательное |
2,3,4,8 |
м |
ед. |
им. вин. |
неодушевленный |
- |
воинский |
ЕНЫ |
глагол |
14 |
любой |
мн. |
- |
любая |
пассив |
вручены |
Каждая из словоформ исходной фразы сопоставляется с графой аффиксыс целью определения подходящего аффикса и «отрезания» его от словоформы. В результате образуется основа, которой приписывается некоторая морфологическая информация. Например, словоформе ВОПРОСЫ соответствует аффикс Ы. Его удаление из словоформы дает основу ВОПРОС и два набора морфологической информации. Первый набор связан с частью речисуществительное, второй – с частью речиприлагательное. Результирующее множество морфологических типов образуется путем объединения множеств морфологических типов для соответствующих частей речи.
Результат определения морфологического типа и выделения основы для нашего примера показан в таблице 5.2.
Результат первого этапа морфологического анализа из примера
Таблица 5.2
основа |
часть речи |
морфологические типы |
СТУДЕНТ |
существительное |
11 |
РАССМОТР |
глагол |
14 |
РАССМОТРЕН |
существительное |
1,2,7,13,18 |
РАССМОТРЕН |
прилагательное |
9 |
ВОПРОС |
существительное |
1,2,7,13,18 |
ВОПРОС |
прилагательное |
9 |
МЕЖДУНАРОДН |
прилагательное |
1,5,6,9 |
ОТНОШЕНИ |
существительное |
8,9,19,20,27 |
ОТНОШЕН |
прилагательное |
2,3,4,8 |
Серьезный недостаток полученного результата – двойственное описание основы ВОПРОС и неоднозначность выделения основ для исходных словоформ РАССМОТРЕНЫ и ОТНОШЕНИЙ. Полученная неоднозначность устраняется на втором шаге.
Пусть таблица суффиксов и квазисуффиксов имеет вид таблицы 5.3.
Таблица суффиксов и квазисуффиксов
Таблица 5.3
признак |
значение |
часть речи |
морфологические типы |
суффикс |
ЕН |
глагол |
14 |
квазисуффикс |
С |
существительное |
1,6,8,12 |
квазисуффикс |
Н |
прилагательное |
1,3,6 |
суффикс |
ЕНИ |
существительное |
27 |
Для основы РАССМОТРЕН выбирается суффикс ЕН. Однако части речи не совпадают, поэтому данная основа рассматривается как неверно выделенная. Оставшейся основе РАССМОТР соответствуют суффикс ЕН и квазисуффикс Н. Поскольку суффикс имеет больший приоритет, чем квазисуффикс, принимается суффикс ЕН и соответствующая ему морфологическая информация.
Для основы ВОПРОС выбирается квазисуффикс С. Пересечение этих двух таблиц показывает, что общий морфологический тип – 1, значит, у основы ВОПРОС морфологический тип – 1, а часть речи - существительное. В этом случае с данной основой связывается вся морфологическая информация, соответствующая морфологическому типу 1. Аналогично и для остальных основ.
Тогда результат второго шага выделения основы имеет вид таблицы 5.4:
Результат второго этапа морфологического анализа из примера
Таблица 5.4
гипотетическая. основа |
часть речи |
род |
число |
падеж |
одушевленность |
пассивность |
морфологические типы |
СТУДЕНТ |
существительное |
м ср |
ед. |
твор. |
любая |
- |
11 |
РАССМОТРЕН |
глагол |
любой |
мн. |
- |
любая |
пассив |
14 |
ВОПРОС |
существительное |
м |
мн. |
им. |
любая |
- |
1 |
МЕЖДУНАРОДН |
прилагательное |
любой |
мн. |
вин. род. |
неодушевленный |
- |
1,6 |
ОТНОШЕНИ |
существительное |
ср |
мн. |
род. |
любая |
- |
27 |