Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
dissa2.docx
Скачиваний:
57
Добавлен:
12.06.2018
Размер:
896.17 Кб
Скачать

Министерство образования Республики Беларусь

Учреждение образования

Белорусский государственный университет

информатики и радиоэлектроники

УДК____________

Ковалевский

Александр, Михайлович

Алгоритмы профилирования пользователей посредством нейронных сетей

Диссертация

на соискание степени магистра технических наук

по специальности ____________________________________________

(шифр и название специальности согласно учебному плану)

_____________________________

(подпись магистранта)

Научный руководитель

Гуринович Алевтина Борисовна

_____________________________

(ученая степень, ученое звание)

_____________________________

(подпись научного руководителя)

Минск 2018

Реферат

АЛГОРИТМЫ ПРОФИЛИРОВАНИЯ ПОЛЬЗОВАТЕЛЯ ПОСРЕДСТВОМ НЕЙРОННЫХ СЕТЕЙ: магистерская диссертация / А. М. Ковалевский – Минск : БГУИР, 2018, – п.з. – 56 с.

Магистерская диссертация на тему «Алгоритмы профилирования пользователя посредством нейронных сетей» рассматривает проблему анализа данных при профилировании пользователей. В данном исследовании рассматривается персонализация данных с помощью нейронных сетей с целью упрощения и оптимизации процесса поиска подходящей информации для каждого пользователя.

Магистерская диссертация представлена в виде пояснительной записки на 56 страницах, состоящей из введения, шести разделов и заключения.

В первом разделе приведено описание понятия семантической паутины, а также профилирования пользователя.

Второй раздел посвящён работе с веб-данными, описанию источников данных и их обработке.

Третий раздел содержит некоторые подходы к автоматическому анализу информации на основе профиля пользователя.

В четвёртом разделе приводится описание понятия нейронной сети и её архитектуры.

Пятый раздел посвящен описанию архитектуры сверточных нейронных сетей.

В шестом описаны разработанные алгоритмы и приведены результаты их работы.

В результате работы над магистерской диссертацией были разработаны два алгоритма для классификации текстов на основе сверточных нейронных сетей для задачи профилирования пользователя.

Результаты, полученные в ходе магистерского исследования, могут использоваться во множественных сферах, таких как фильтрация документов, поиска информации, перевода текстов, таргетировании рекламы, распознавание спама и др.

Содержание

Введение 5

Постановка задачи 8

1. Профилирование пользователей 9

2. Работа с веб-данными 11

2.1 Источники данных 11

2.2 Обработка данных 11

3. Содержимое на основе профиля пользователя 13

3.1 Управление данными 13

3.2 Профилирование пользователя для веб-просмотра 14

3.3 Классификация профилей пользователя 14

3.3.1 Индексация и предобработка 15

3.3.2 Извлечение термов 16

3.3.3 Взвешивание термов с использованием статистических мер 18

3.3.4 Перевод текста в векторное представление 19

3.4 Проблемы традиционного метода классификации текстов при задаче профилирования пользователя 20

4. Нейронные сети 23

4.1 Функции активации 24

4.2 Функция потерь 24

5 Сверточные нейронные сети 26

5.1 Архитектура сверточной нейронной сети 26

5.1.1 Полносвязный слой 27

5.1.2 Сверточный слой 28

5.1.3 Cубдискретизирующий слой 28

5.1.4 Dropout слой 29

5.2 Модели использования сверточной нейронной сети для классификации текстов 29

5.2.1 Посимвольный подход 30

5.2.2 Подход c использованием кодирования слов 31

6 Использование сверточной нейронной сети для профилирования 33

6.1 Алгоритм при векторной репрезентации слов и текстов 33

6.2 Алгоритм при семантической репрезентации слов и текстов 39

6.3 Результаты работы алгоритмов 40

Заключение 44

Библиографический список 46

Приложение 48

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]