- •Поисковые системы: поле боя - семантика Дмитрий ландэ Феномен десятилетия
- •Характеристики поисковых систем
- •Пертинентность
- •Что такое релевантность
- •Как определяется релевантность.
- •Пертинентность
- •Запросы пользователей
- •Поиск по параметрам
- •Профессиональные запросы к традиционным системам
- •Кластеризация
- •Поиск по подобию
- •Ранжирование откликов
- •Семантические методы
- •"Сюжетный" подход
- •Тернистый путь прогресса
Тернистый путь прогресса
Синтаксис запросов к популярным поисковым системам в последнее время значительно упростился, вместе с тем, качество откликов постоянно улучшается, несмотря на лавинообразный рост ресурсов Сети.
Традиционные подходы к поиску, основанные использовании логических операторов потерпели крах одновременно с бумом веб-технологий. Первые скрипки в поисковых системах стали играть не инструменты индексирования баз данных и организации логического поиска, а новые семантические алгоритмы. Можно признать, что пионером в этом стала компания Google, поставившая на ранжирование выдачи и алгоритмы, основанные на цитируемости.
Незавидна роль традиционных систем искусственного интеллекта в этой "семантической революции". Системы, основанные на базах знаний в большинстве своем не выдержали силы потока Интернет-информации. При этом речь идет не столько об объемах, сколько о политематичности и динамике, т.е. о постоянном обновлении информации, которое к тому же не имеет очевидной тематической направленности и регулярности.
При этом возник новый класс систем, который все же позволяет справляться с "проблемой размерности" Сети. Сегодня можно рассматривать как один из удивительных феноменов тот факт, что содержательные, семантически наполненные результаты формируются без непосредственного привлечения методов искусственного интеллекта, объемных баз знаний и даже экспертов как таковых, а путем использованием частотно-лингвистических и эвристических методов. И сегодня эффективно работают в основном системы, базирующиеся именно на таких методах.