Классификация текста — это фундаментальная задача обработки естественного языка (NLP), которая включает в себя присвоение предопределенных категорий или меток текстовым данным. Двоичная классификация — это особый тип классификации текста, целью которого является классификация текста по одной из двух категорий или классов. Этот тип классификации имеет множество практических применений, таких как анализ настроений, обнаружение спама и медицинская диагностика.

В последние годы значительно увеличилось количество алгоритмов машинного обучения, разработанных для работы с текстом…