6Заключение

В данной работе проводилось исследование векторных представлений слов на основе нейронных сетей.

Нейронные сети давно успешно используются в задачах распознавания изображений. В данной работе была рассмотрена специальная архитектура сетей для решения таких задач. Для задач обработки текстов нейросетевые решения также существуют довольно долгое время, однако эффективные решения в смысле вычислительной сложности стали появляться сравнительно недавно.

Одно из таких решений – модель word2vec для получения векторного представления слов – было подробно рассмотрено в данной работе. Одним из преимуществ word2vec являются существенно меньшие вычислительные затраты на обучение по сравнению со всеми ранее известными нейросетевыми языковыми моделями, в частности, благодаря представлению словаря в виде дерева Хаффмана и иерархическому softmax’у.

Результаты решения задачи определения демографических атрибутов пользователей сервиса Twitter говорят о применимости языковой модели word2vec для решения задач обработки текстов. Преимуществом этой модели по сравнению с широко известной языковой моделью n-грамм является существенное понижение размерности признаков при аналогичном качестве работы, а также уменьшение вычислительных затрат на обучение.

Таким образом, можно сделать основной вывод данной работы – нейронные сети обладают большим потенциалом для решения задач обработки текстов и способны справляться с ними лучше популярных на сегодняшний день решений.

Список литературы

[1]Mikolov T., tau Yih W., Zweig G. Linguistic regularities in continuous space word representations // In Proceedings of NAACL HLT. 2013.

[2]Haykin S. Neural Networks: A Comprehensive Foundation. 2 edition. Prentice-Hall, 1999.

[3]Characterization of a class of sigmoid functions with applications to neural networks / S. Ranka, C. Mohan, K. Mehrotra, A. Menon // Neural Networks. 1996. Vol. 9. Pp. 819–835.

[4]Petrov S. Convolutional neural network for recogniton of licence plate symbols: Tech. rep.: Dubna International University of Nature, Society and Man, Institute of system analysis and management, 2013.

[5]Katz S. Estimation of probabilities from sparse data for the language model component of a speech recogniser // IEEE Transactions on Acoustics, Speech, and Signal Processing. 1987. Vol. 35, no. 3. Pp. 400–401.

[6] A neural probabilistic language model / Y. Bengio, R. Ducharme, P. Vincent,

C.Jauvin // Journal of Machine Learning Research. 2003. no. 3. Pp. 1137–1155.

[7]E cient estimation of word representations in vector space / T. Mikolov, K. Chen,

G.Corrado, J. Dean // In Proceedings of Workshop at ICLR. 2013.

[8]Distributed representations of words and phrases and their compositionality / T. Mikolov,

I.Sutskever, K. Chen et al. // In Proceedings of NIPS. 2013.

<<< < Предыдущая 1 2 3 4 5 6 7 89 / 99

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
20.06.2018906.83 Кб47dissa6.docx
#
24.10.2018172.74 Кб0IEred (2).rar99
#
12.06.20181.65 Mб18master2014_1_popkov.pdf
#
05.07.2018274 б1new 1.txt
#
05.06.2018337.84 Кб1osnnaprbfnp2018_2020.pdf
#
12.06.2018747.63 Кб64thesis3 (1).pdf
#
05.06.2018415.63 Кб1wallhaven-633364.jpg
#
05.06.2018794.48 Кб1wallhaven-634255.jpg
#
05.06.20184.11 Mб1wallhaven-639039.jpg
#
06.06.20181.63 Кб1доки для вставки в диссу.txt
#
19.06.201815.71 Кб4ОТЗЫВ НАУЧНОГО РУКОВОДИТЕЛЯ.docx