- •В.П. Захаров
- •1.1. Основные понятия информационного поиска
- •1.2. Информационный поиск в сети Интернет
- •1.3. Языки запросов ипс Интернет
- •Краткое содержание разделов
- •Раздел 1. Основы информационного поиска
- •Раздел 2. Документальные ипс
- •Раздел 3. Фактографические ипс
- •Раздел 4. Лингвистическое обеспечение информационного поиска
- •Раздел 5. Функционирование и эксплуатация ипс
- •Раздел 6. Информационный поиск в сети Интернет
- •Раздел 7. Настоящее и будущее информационного поиска
- •2.4. Примерная тематика докладов, рефератов, курсовых работ
- •2.5. Примерный перечень вопросов к экзамену (зачету) по всему курсу
- •2.6. Распределение часов курса по темам и видам работы
- •2.7. Форма текущего, промежуточного и итогового контроля
- •2.8. Учебно-методическое обеспечение курса Основная литература
- •Дополнительная литература
- •Стандарты
- •Лабораторная работа № 1
- •Лабораторная работа № 2
- •Результаты сравнительного изучения систем Апорт, Яндекс, Рамблер
- •Лабораторная работа № 3
- •Лабораторная работа № 4
- •Лабораторная работа № 5
- •Лабораторная работа № 6
- •Лабораторная работа № 7
- •Лабораторная работа № 8
- •Лабораторная работа № 9
- •Лабораторная работа № 10
- •Содержание
Лабораторная работа № 2
(Русскоязычные вербальные ИПС: сравнительный анализ)
Работа заключается в сравнительном изучении систем Апорт, Яндекс, Рамблер. Результаты изучения студент должен отразить в виде таблицы (с. 34) в файле Report2 (ориентация таблицы — альбомная). В ячейках записать, как в каждой системе представляется тот или другой элемент языка запросов или входного/выходного интерфейса (все допустимые способы). В некоторых случаях можно отвечать знаками «+» или «–» (например, «Описание документа») или свободным текстом своими словами (например, «Релевантные страницы того же сайта» или «Сортировка»).
Перейти на сайт поисковой системы Апорт (затем Яндекс и Рамблер). Найти в каждой системе ссылки на ее описание в целом, на описание языка запросов, интерфейсов («Справка», «Помощь», «Расширенный поиск» и т.п.). Перейдя по ссылкам, внимательно изучить справочную информацию и в рабочей тетради кратко законспектировать основные пункты. После этого для каждой системы заполнить соответствующие ячейки таблицы (разделы 1, 2).
Примечание. Если текст ответа не помещается в ячейке таблицы, рекомендуется делать сноску и продолжать его под таблицей. Обратить внимание на то, что возможности систем в простом и в расширенном поиске различаются. Отразить это в отчете. Обратить внимание на наличие разделов «другое».
Вернуться назад на начальную страницу поисковой системы Апорт (затем Яндекс и Рамблер). Ввести какой-либо запрос (например, «Статистические методы в лингвистике») в окне для текстового запроса и провести поиск. Страницу с результатами поиска сохранить в своей папке в формате «только html».
Изучить форму представления результатов. Кратко записать в тетради, что содержится на веб-странице с результатами поиска (структуру веб-страницы). Изучить форму представления отдельных веб-документов (их краткие описания с дополнительной информацией). На основе изучения полученных результатов и ранее изученной справочной информации заполнить соответствующие ячейки таблицы (раздел 3).
Предъявить работу преподавателю.
Результаты сравнительного изучения систем Апорт, Яндекс, Рамблер
№ раздела |
Параметры |
Апорт |
Яндекс |
Рам-блер |
|
Поиск по тексту |
|
|
|
1. |
Логические операторы: |
|
|
|
1.1 |
конъюнкция |
|
|
|
1.2 |
дизъюнкция |
|
|
|
1.3 |
отрицание |
|
|
|
|
Синтагматические операторы: |
|
|
|
1.4 |
фразы (словосочетания, слова рядом) |
|
|
|
1.5 |
расстояние в словах |
|
|
|
1.6 |
расстояние в предложениях |
|
|
|
1.7 |
Морфологическая нормализация (автоматическая, используемые метасимволы) |
|
|
|
2. |
Поиск по полям |
|
|
|
2.1 |
по заглавию |
|
|
|
2.2 |
по полю ключевых слов |
|
|
|
2.3 |
по комментарию к картинкам (поле ALT) |
|
|
|
2.4 |
по тексту гиперссылок |
|
|
|
2.5 |
по адресам ссылок |
|
|
|
2.6 |
по доменному имени сайта (сервера) |
|
|
|
2.7 |
по языку |
|
|
|
2.8 |
по дате |
|
|
|
2.9 |
по формату |
|
|
|
2.10 |
Другие |
|
|
|
3. |
Интерфейс выдачи (форма представления результатов) |
|
|
|
3.1 |
статистика слов из запроса |
|
|
|
3.2 |
количество найденных документов |
|
|
|
3.3 |
количество найденных сайтов |
|
|
|
3.4 |
количество документов на странице результатов |
|
|
|
3.5 |
сортировка документов на странице выдачи |
|
|
|
3.6 |
поиск в найденном |
|
|
|
3.7 |
описание документа включает следующие элементы: |
|
|
|
|
URL (адрес в сети) |
|
|
|
|
размер документа (объем) |
|
|
|
|
дата создания |
|
|
|
|
кодировка |
|
|
|
|
аннотация (краткое содержание) |
|
|
|
|
указание на другие релевантные веб-страницы того же сайта |
|
|
|
|
ссылка на рубрику каталога, к которой относится найденный документ или сайт |
|
|
|
|
поиск похожих документов |
|
|
|
|
другое |
|
|
|