ivdon3@bk.ru
Рассматривается разработка и применение методов предварительной обработки табличных данных для решения задач многозначной классификации компьютерных атак. Объектом исследования является набор данных, содержащий многозначные записи, собранный при помощи разработанного авторами программно-аппаратного комплекса. Проведен анализ атрибутов набора данных, в ходе которого были выявлены 28 атрибутов, которые имеют наибольшую информационную важность при их использовании для классификации алгоритмами машинного обучения. Обоснована целесообразность использования автокодировщиков в области информационной безопасности, в задачах, связанных с наборами данных, обладающих свойством многозначности целевых атрибутов. Практическая значимость: предварительная обработка данных может быть использована для повышения точности обнаружения и классификации многозначных компьютерных атак.
Ключевые слова: информационная безопасность, компьютерные атаки, multi-label, multi-label classification, многозначная классификация, анализ набора данных, сбор экспериментальных данных, многозначные данные, сетевые атаки, информационная безопасность
2.3.6 - Методы и системы защиты информации, информационная безопасность