ivdon3@bk.ru
В работе рассматриваются подходы к решению таких задач обработки естественного языка, как извлечение ключевых понятий или терминов, а также семантических связей между ними для построения IT-решений на основе данных. Тема работы актуальна ввиду постоянного роста объёмов слабо структурированного и неструктурированного текста в электронном формате. Извлечённая информация может быть использована для улучшения многих процессов: автоматическое тегирование, оптимизация поиска по контенту, построение облаков слов и навигации; кроме того, для создания черновых версий словарей, тезаурусов и даже базы для экспертных систем.
Ключевые слова: обработка естественного языка, термин, лемма, семантическая связь, статистическая обработка, машинное обучение, word2vec
В работе рассматривается использование машинного обучения применительно к обработке естественного языка (сентимент-анализа, анализа семантической близости) для построения рекомендательной системы по выбору парфюмерной продукции. Тема работы актуальна ввиду роста спектра выпускаемой парфюмерной продукции и сложности выбора её потребителями и продвижения производителями. Предлагаемые подходы релевантны для решения данной проблемы ввиду наличия накопленных текстовых отзывов и обзоров парфюмерной продукции на различных веб-сайтах, включая интернет-магазины.
Ключевые слова: машинное обучение, обработка естественного языка, сентимент-анализ, дистрибутивная семантика, word2vec, рекомендательные системы
05.13.18 - Математическое моделирование, численные методы и комплексы программ