Добавил:
Wehif
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз:
Предмет:
Файл:thesis3 (1).pdf
X
- •Аннотация
- •Введение
- •Постановка задачи
- •Обзор существующих решений
- •Основные принципы функционирования и обучения нейронных сетей
- •Архитектура нейронных сетей
- •Алгоритм обратного распространения ошибки
- •Сверточные нейронные сети в задачах распознавания изображений
- •Архитектура и принцип работы сверточных нейронных сетей
- •Распознавание символов номерного знака автомобиля с использованием сверточной нейронной сети
- •Выводы
- •Нейронные сети в задачах обработки текстов
- •Статистические языковые модели. Проклятие размерности
- •Нейросетевая языковая модель Y. Bengio
- •Исследование и построение решения задачи
- •Описание решения задачи при помощи word2vec
- •Описание практической части
- •Выбранный инструментарий
- •Описание обучающей и тестовой выборок
- •Результаты решения задачи при помощи word2vec
- •Выводы
- •Заключение
- •Список литературы
5.5Выводы
На основании результатов решения задачи определения демографических атрибутов
пользователей сервиса Twitter можно сделать следующие выводы:
Языковая модель n-грамм показывает хорошие результаты только при использовании больших размерностей признаков. Очень вероятно, что дальнейшее увеличение параметра M (например, до 3200) увеличит точность классификации. Однако такие размерности связаны с большими вычислительными затратами на обучение.
Несомненным преимуществом word2vec по сравнению с n-граммами является существенное понижение размерности признаков. При размерности признаков до 1000 модель word2vec показывает значительно лучшие результаты.
30
Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]