Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
thesis3 (1).pdf
Скачиваний:
64
Добавлен:
12.06.2018
Размер:
747.63 Кб
Скачать

5.5Выводы

На основании результатов решения задачи определения демографических атрибутов

пользователей сервиса Twitter можно сделать следующие выводы:

Языковая модель n-грамм показывает хорошие результаты только при использовании больших размерностей признаков. Очень вероятно, что дальнейшее увеличение параметра M (например, до 3200) увеличит точность классификации. Однако такие размерности связаны с большими вычислительными затратами на обучение.

Несомненным преимуществом word2vec по сравнению с n-граммами является существенное понижение размерности признаков. При размерности признаков до 1000 модель word2vec показывает значительно лучшие результаты.

30

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]