Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
dissa2 old.docx
Скачиваний:
27
Добавлен:
12.06.2018
Размер:
790.09 Кб
Скачать

1. Профилированиепользователей

Семантическая паутина – это общедоступная глобальная семантическая сеть, формируемая на базе интернета путём стандартизации представления информации в виде, пригодном для машинной обработки.

Семантическая паутина с каждым годом набирает обороты и привычный пользовательский анализ данных сменяет машинный. Семантическая паутина создана для того, чтобы сделать информацию пригодной для автоматического анализа, синтеза выводов и преобразования как самих данных, так и сделанных на их основе заключений в различные представления, полезные на практике. Технически говоря, семантическая паутина - это данные, представленные в некоторой форме, которые позволяют компьютерам эффективно обмениваться информацией между собой, целью которых, является создание более качественного конечного интерфейса пользователя.

В обычной Всемирной паутине, основанной на HTML-страницах, информация заложена в тексте страниц и предназначена для чтения и понимания человеком. Семантическая паутина состоит из машинно-читаемых элементов – узлов семантической сети, с опорой на онтологии. Благодаря этому программы-клиенты получают возможность непосредственно получать из интернета утверждения вида «предмет – вид взаимосвязи – другой предмет» и вычислять по ним логические заключения. Семантическая паутина работает параллельно с обычной Всемирной паутиной и на её основе, используя протокол HTTP и идентификаторы ресурсов URI.

Так как данные могут быть представлены в разном виде, один из возможных источников получения информации – это использование пользовательского профилирования.

Информация о пользователе может быть представлена несколькими способами. Как правило, если мы говорим о более абстрактной и обобщенной информации, мы говорим о "профиле пользователя" или "модели пользователя", которые включают в себя основную характеристику пользователя и данные о поведении пользователя. С точки зрения данных, пользователь является ключевым источником получения мета-данных. В дальнейшем полученная информация может быть использована для повышения эффективности взаимодействия пользователя с системой.

2. Работа с веб-данными

2.1 Источники данных

Есть несколько видов данных, которые являются наиболее важными в веб-персонализации. Эти данные разделены на четыре основные категории: (I) данные из журналов веб-доступа, (II) данные контента, (III) веб-структура данных сайта, и (IV) демографические данные.

Данные журналов веб-доступа. Веб-журналы содержат информацию о пользователях, имеющих доступ к сайту. Журналы в основном хранятся просто в виде текстовых файлов. Веб-журнал содержит следующую информацию: (I)IP-адрес пользователя, (II) имя аутентификации пользователя, (III) время доступа, (IV) запросHTTP, (V) статус ответа, (VI) размер запрашиваемого ресурса, и, возможно, (VII)URL-адрес ссылающейся страницы и (VIII) браузер пользователя.

Данные контента. Данные контента - содержимое, которое может быть доступно пользователям. Здесь мы не имеем в виду только текстовую информацию, также к данному понятию относятся изображения и другой мультимедийный контент. Обычно мы имеем дело только с текстовой информацией.

Веб структура данных сайта. Структура сайта подготовленная дизайнером веб-сайта или с помощью генераторов, которые используются в веб-персонализации, для автоматической генерации удобной пользователю структуры веб-сайта.

Демографические данные. Демографические данные - данные, полученные от пользователя путем анкетирования. Такой способ сбора данных, как правило, не очень охотно воспринимается пользователями. Таким образом, этот вид получения данных, как правило, не используется, за исключением случаев, когда пользователь получает непосредственно выгоду от предоставления правильной информации.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]