СРАВНЕНИЕ ЭФФЕКТИВНОСТИ АЛГОРИТМОВ МАШИННОГО ОБУЧЕНИЯ ПРИ ОБНАРУЖЕНИИ СПАМ СООБЩЕНИЙ НА КАЗАХСКОМ ЯЗЫКЕ
DOI:
https://doi.org/10.54251/2616-6429.2025.01.07nuКлючевые слова:
машинное обучение, спам, обнаружение спама, методы фильтрации спама, казахский язык, алгоритмы машинного обучения, эффективностьАннотация
В статье представлен сравнительный анализ производительности различных алгоритмов машинного обучения для обнаружения спама, с особым акцентом на их применении к казахскому языку. Рассматриваемые методы включают байесовскую фильтрацию спама (MNB), k-ближайших соседей (KNN), опорные векторные машины (SVM) и деревья решений (DT). Традиционно спам использовался для продвижения продуктов и услуг потенциальным клиентам. Однако он превратился в инструмент для взлома и распространения вирусов. Для решения этой проблемы учеными и исследователями были предложены различные методы обнаружения и фильтрации спама. Ниже приведены различные категории методов фильтрации спама: Методы фильтрации спама на основе случаев; Методы фильтрации на основе контента; Методы фильтрации на основе списков; Методы эвристической или основанной на правилах фильтрации спама; Методы адаптивной фильтрации спама. Разработка и оценка различных подходов машинного обучения для обнаружения спама на казахском языке может стать потенциальной исследовательской проблемой. Наша цель в решении этих исследовательских проблем заключается в обогащении текущей литературы путем предложения моделей машинного обучения, которые могут обнаруживать спам-сообщения на казахском языке.