МАШИННОЕ ОБУЧЕНИЕ И ЭВРИСТИЧЕСКИЕ МЕТОДЫ В ЗАДАЧАХ КЛАССИФИКАЦИИ ТЕКСТОВ ДЛЯ ИНФОРМАЦИОННОЙ БЕЗОПАСНОСТИ
##plugins.themes.bootstrap3.article.main##
Аннотация
Статья посвящена сравнительному анализу эвристических и обучаемых методов в задачах классификации текстов, рассматриваемых в контексте информационной безопасности. В качестве прикладного примера выбрана задача фильтрации спам-сообщений, позволяющая продемонстрировать особенности, преимущества и ограничения каждого подхода. Описана реализация двух систем: эвристической, основанной на наборе детерминированных правил, и обучаемой модели, использующей алгоритмы машинного обучения и предварительную обработку текстов на естественном языке. Далее проведено экспериментальное сравнение качества классификации, скорости обработки и гибкости адаптации обеих систем. Особое внимание уделено критериям точности, полноты, F1-меры, а также возможностям автономного функционирования и расширяемости. В заключении на основе полученных результатов формулируются выводы о целесообразности применения каждого из подходов в зависимости от условий эксплуатации и требований к безопасности.