- •Курс лекций
- •Технологии поиска информации
- •Иркутск 2012 Оглавление
- •Введение
- •1. Основные принципы технологии поиска информации
- •1.1 Понятия и определения
- •1.2 Информационная потребность пользователя
- •1.3 Релевантность
- •1.4 Общая схема процесса поиска
- •2. Представление информации в ипс
- •2.1. Индексирование документов
- •2.2. Векторная модель текста
- •2.3. Статистический анализ текстов. Закон Ципфа
- •2.4. Анализ информационных массивов
- •2.4.1. Понятие относительной частоты
- •2.4.2 Распределение частоты встречаемости терминов
- •2.4.3 Определение весов терминов
- •2.4.4 Частотная модель
- •2.4.5 Вероятностная модель
- •2.4.6 Латентно-семантический анализ
- •2.5 Хранение индексированных документов
- •3 Модели поиска информации
- •3.1 Булева модель поиска
- •3.2 Функции подобия "документ-запрос"
- •3.2.1 Алгоритм расширенного булевого поиска
- •3.2.2 Алгоритм наибольшего цитирования
- •3.2.3 Векторный алгоритм поиска
- •3.2.4 Расширенный векторный алгоритм поиска
- •4. Классификация документов
- •4.1. Основные свойства классификации
- •4.2 Формирование рубрик
- •5 Эффективность поисковых систем
- •5.1 Критерии эффективности
- •5.2. Полнота и точность поиска
- •5.3. Недостатки основных характеристик
- •6 Современные информационно-поисковые системы
- •6.1. Словарные информационно-поисковые системы
- •6.2 Классификационные информационно-поисковые системы
- •6.3. Метапоисковые системы
- •Заключение
- •Список рекомендуемой литературы
- •Экзаменационные вопросы
Заключение
Практика информационного поиска ставит перед исследователями все новые и новые задачи, не позволяя останавливаться на достигнутом и заставляя создавать новые теории и методы, проектировать и моделировать новые системы.
Распознавание, индексирование и поиск документов разных форматов и представлений, включая мультимедийные; использование инструментов и ресурсов систем управления базами данных в ИПС; развитие технологий поиска в сети Интернет, в частности, обработка очень больших объемов информации, архитектурная реализация систем – вот лишь самые основные перспективные направления развития современных ИПС.
Следует также сказать о постоянном повышении требований к ИПС в плане эффективности организации взаимодействия человека и поисковой системы, главным образом, к проектированию пользовательских интерфейсов ИПС, ориентации систем на манеру работы человека, его ожидания и предпочтения.
Список рекомендуемой литературы
1.Добрынин В. Ю. Теория информационно-логических систем. Информационный поиск: Метод. указания к курсу информационного поиска. – СПб. : Изд-во СПбГУ, 2002.
2.Дубинский А. Г. Некоторые вопросы применения векторной модели представления документов в информационном поиске // Управляющие системы и машины. – 2001. – № 4.
3.Капустин В. А. Основы поиска информации в Интернете. Методическое пособие. – СПб. : Институт "Открытое общество", С.-Петерб. отд-ние, 1998.
4.Когаловский М. Р. Перспективные технологии информационных систем. М. : ДМК Пресс : Компания АйТи, 2003.
5.Кромер В. В. Об одной поправке к каноническому закону // Телеконференция "Информационные технологии в гуманитарных науках". – Казань, 1998.
6.Кураленок И. Е. Оценка систем текстового поиска / И. Е. Кураленок, И. С. Некрестьянов // Программирование. – 2002. – № 4.
7.Некрестьянов И. С. Системы текстового поиска для Веб / И. С. Некрестьянов, Н. Пантелеева // Программирование. – 2002. – № 4.
8.Попов А. Поиск в Интернете – внутри и снаружи // Internet. – 1996. – № 2.
9.Сегалович И. В. Как работают поисковые системы // Мир Internet. – 2002. – № 10.
10.Солтон Дж. Динамические библиотечно-информационные системы. – М. : Мир, 1979.
11.Храмцов П. Информационно-поисковые системы Internet// Открытые системы. – 1996. – № 3(17).
12.Храмцов П. Моделирование и анализ работы информационно-поисковых систем Internet// Открытые системы. – 1996. – № 6(20).
13.Чугреев В. Л. Модель структурного представления текстовой информации и метод ее тематического анализа на основе частотно-контекстной классификации: дис. канд. техн. наук: 05.13.01 / С.-Петерб. гос. электротехн. ун-т им. В.И. Ульянова (Ленина) “ЛЭТИ”. – СПб., 2003.
14.Чурсин Н. Н. Популярная информатика. – Киев. : Техника, 1982.
Экзаменационные вопросы
Основные принципы технологии поиска информации
Информационная потребность пользователя
Релевантность
Общая схема процесса поиска информации
Индексирование документов
Векторная модель текста
Статистический анализ текстов. Закон Ципфа
Анализ информационных массивов
Хранение индексированных документов
Модели поиска информации
Основные свойства классификации
Формирование рубрик
Критерии эффективности
Полнота и точность поиска
Эффективность ИПС.
Словарные информационно-поисковые системы
Структуризация словарей
Классификационные информационно-поисковые системы
Метапоисковые системы
Поиск необходимой информации в Интернете
Поиск с помощью поисковых машин по ключевому слову
Поиск с помощью классификаторов поисковых машин
Каталоги и коллекции ссылок (общие понятия)
Рейтинги (популярные ресурсы)
Конференции, чаты
Поиск информации о телеконференциях (Usenet)
Поиск по FTP-cерверам
Отечественные поисковые службы.
Приемы расширенного поиска информации в Интернет
Поисковые базы данных
Поиск людей в сети Internet