ISSN 1991-2927
 

АПУ № 3 (61) 2020

Автор: "Константинов Андрей Алексеевич"

/table>

УДК 004.89, 004.912

Ярушкина Надежда Глебовна, доктор технических наук, профессор, окончила Ульяновский политехнический институт по специальности «Электронные вычислительные машины». Заведующая кафедрой «Информационные системы» Ульяновского государственного технического университета. Имеет более 400 научных работ в области мягких вычислений, нечеткой логики, гибридных систем. [e-mail: jng@ulstu.ru]Н.Г. Ярушкина,

Мошкин Вадим Сергеевич, окончил факультет информационных систем и технологий УлГТУ, доцент кафедры «Информационные системы» УлГТУ. Имеет более 90 статей в области интеллектуальных систем анализа данных. [e-mail: v.moshkin@ulstu.ru]В.С. Мошкин,

Константинов Андрей Алексеевич, магистрант кафедры «Информационные системы» УлГТУ. Имеет статьи в области интеллектуального анализа текстовых данных. Область научных интересов – автоматизация анализа текстов с использованием машинного обучения. [e-mail: adwaises@mail.ru]А.А. Константинов

Применение языковых моделей word2vec и BERT в задаче сентимент-анализа текстовых сообщений социальных сетей61_7.pdf

В работе предложен оригинальный алгоритм формирования обучающей выборки для нейронной сети, обеспечивающей сентимент-анализ текстовых сообщений социальных сетей. Особенностью алгоритма является использование расширенного русскоязычного семантического тезауруса WordNetAffect и экспертного словаря авторских символов выражения эмоций. Помимо этого, в работе описывается применение нейронной сети на базе LSTM- архитектуры для определения эмоциональной окраски текстовых сообщений социальной сети с применением двух алгоритмов векторизации текста «word2vec» и «BERT». В результате проведенных экспериментов был достигнут показатель точности определения эмоциональной окраски сообщений в 87% с использованием лемматизации в качестве алгоритма предобработки текста и алгоритма «BERT» при его преобразовании в векторную форму.

Сентимент-анализ, BERT, word2vec, нейронная сеть, социальная сеть.

2020_ 3

Рубрика: Искусственный интеллект

Тематика: Искусственный интеллект.

© ФНПЦ АО "НПО "Марс", 2009-2018 Работает на Joomla!