Особенности реализации алгоритмов морфологического анализа в DLP-системах

##plugins.themes.bootstrap3.article.main##

Андрей Сергеевич Шабуров
Елена Евгеньевна Журилова

Аннотация

В статье анализируется проблема выбора оптимального алгоритма морфологического анализа для DLP-систем. Рассматриваются основные алгоритмы, используемые для морфологического анализа: стеммер Портера, Stemka и Mystem, а также алгоритм определения слова по суффиксам и аффиксам. Выявляются их возможности,
достоинства и недостатки. Приводятся схемы работы этих алгоритмов и их описание. Рассматривается возможность применения этих алгоритмов в DLP-системах
на основе сравнения их характеристик и нахождения оптимальных вариантов. Предлагается структурная модель, определяющая место морфологического анализа
в функционировании DLP-системы.

##plugins.themes.bootstrap3.article.details##

Раздел
МАТЕМАТИЧЕСКИЕ МЕТОДЫ В ОБЕСПЕЧЕНИИ ИНФОРМАЦИОННОЙ БЕЗОПАСНОСТИ