ISSN 1991-2927
 

АПУ № 4 (66) 2021

Автор: "Шигабутдинов Ислам Маратович"

УДК 004.89

Наместников Алексей Михайлович, доктор технических наук, доцент, окончил радиотехнический факультет Ульяновского государственного технического университета. Профессор кафедры «Информационные системы» УлГТУ. Имеет около 100 работ в области автоматизированного проектирования и интеллектуальных систем. [e-mail: nam@ulstu.ru]А.М. Наместников,

Филиппов Алексей Александрович, кандидат технических наук, окончил факультет информационных систем и технологий УлГТУ. Доцент кафедры «Информационные системы» УлГТУ. Имеет статьи в области онтологического моделирования, интеллектуальных систем хранения и обработки информации. [e-mail: al.filippov@ulstu.ru]А.А. Филиппов,

Шигабутдинов Ислам Маратович, магистр направления «Программная инженерия», окончил факультет информационных систем и технологий УлГТУ. Имеет статьи в области интеллектуального анализа текстовых данных. [e-mail: isl23@mail.ru]И.М. Шигабутдинов

Подход к извлечению многословных терминов из текстов на естественном языке с применением синтаксических шаблонов65_12.pdf

При решении задачи извлечения многословных терминов на основе лингвистических методов анализа текстов возникает следующая проблема: эксперт-лингвист не обладает навыками в области разработки программных систем, но от него требуется представление своих знаний в виде фрагментов программной системы или некоторых конструкций на определенном формальном языке. С другой стороны, разработчики программных систем в большинстве случаев не обладают необходимыми компетенциями в лингвистике. Данное обстоятельство порождает семантический разрыв между методами лингвистического анализа текстов и их представлением в виде программной реализации.
В данной работе представлен подход к извлечению многословных терминов на основе синтаксических шаблонов, отличающийся адаптацией на работу с лингвистом и не требующий от лингвиста дополнительных навыков и знаний использования различных языков описания синтаксических шаблонов.
Был разработан прототип программной системы, позволяющий пользователю описывать синтаксические шаблоны без знания формального языка. Также разработанная программная система отличается от аналогов наличием возможности использования синтаксических шаблонов во внешних системах для анализа текстов. Серверная часть прототипа программной системы имеет программный интерфейс для выполнения синтаксических шаблонов.

Анализ текстов на естественном языке, дерево синтаксического разбора, синтаксический шаблон, многословный термин.

21) _ 3

Рубрика: Системы автоматизации проектирования

Тематика: Системы автоматизации проектирования, Искусственный интеллект, Информационные системы.



© ФНПЦ АО "НПО "Марс", 2009-2021 Работает на Joomla!