Публикации по теме 'text-classification'


Классификация чековых этикеток: подход word2vec и CNN
Несмотря на весь прогресс, достигнутый в машинном обучении за последние годы, задачи классификации текстов привлекли к себе большое внимание, и были разработаны интересные решения. Здесь, в компании Aboutgoods, мы сейчас сталкиваемся с классической проблемой классификации текстов. Классика, не правда ли? .. Задача - присвоить номеру позиции исчерпывающую категорию, которая присутствует в чеке в основном из супермаркетов. Например, pineapple juice 1L принадлежит juice..

Проект машинного обучения: предсказание жанра песни по тексту
Введение В качестве моего семестрового проекта я решил построить модель, которая могла бы предсказывать жанр песни по ее тексту. Это непростая проблема, потому что некоторые жанры очень похожи по тексту, а некоторые песни могут принадлежать к большему количеству жанров. Я выбрал 5 жанров для классификации: поп, рок, кантри, электроника и хип-хоп. Я сравнил 4 модели: DNN (глубокая нейронная сеть), XGB (древовидный классификатор), RNN (рекуррентная нейронная сеть) и CNN (сверточная..

Категоризация веб-сайтов
В этой статье мы познакомим вас с нашим инструментом категоризации веб-сайтов, который позволяет легко и с высокой точностью классифицировать домены/URL-адреса по более чем 441 отдельной категории IAB или более чем 1360 категориям электронной коммерции. Наши клиенты с большим успехом используют его для своих рекламных технологий, SaaS, фильтрации веб-контента, кибербезопасности, электронной коммерции и других нужд. В дополнение к нашему инструменту и службе API мы также предоставляем..

Различные методы очистки текста в НЛП
В этом посте мы практически рассмотрим большинство методов очистки текстовых данных. Введение В НЛП очистка текста — утомительная часть. Это требует тщательного анализа того, какую информацию сохранить, а какие части удалить. В частности, это становится сложной задачей, поскольку данные поступают из разных доменов, и мы не хотим пропустить важную информацию. Неправильная очистка может негативно повлиять на наш анализ и конечные результаты. Здесь мы увидим некоторые популярные..

Вопросы по теме 'text-classification'

классификация текста с несколькими метками и обратной связью
В настоящее время я работаю над проблемой классификации текста с несколькими метками и несколькими классами. В какой-то части проблемы мне нужно сообщить пользователю, что на основании того, какие функции, слова или фразы алгоритм решает отнести...
417 просмотров

Нужно ли выполнять удаление стоп-слов, стемминг / лемматизацию для классификации текста при использовании Spacy, Bert?
Необходимы ли удаление стоп-слов, стемминг и лемматизация для классификации текста при использовании Spacy, Bert или других продвинутых моделей НЛП для получения векторного встраивания текста? text = Еда на свадьбе была очень вкусной 1. с тех пор,...
2713 просмотров