Публикации по теме 'nltk'
Машинное обучение-идентификатор пола-повышенная точность с анализом ошибок (пожалуйста, не забудьте…
В моем предыдущем блоге Машинное обучение — идентификатор пола с NLTK менее чем в 15 строках кода мы увидели, как построить модель машинного обучения для определения пола для любого заданного имени, и закончили этот блог, упомянув, что следующие моменты должны быть рассмотрены. в следующей части:
Точность модели с тестовым набором данных Концепции переобучения и недообучения Анализ ошибок для обогащения FeatureSet Как повысить точность с помощью анализа ошибок, чтобы найти..
Раскрытие возможностей НЛП: глубокое погружение в этапы предварительной обработки текста
Конвейер НЛП
Прежде чем перейти к этапам предварительной обработки текста в обработке естественного языка (NLP), давайте взглянем на стандартный конвейер НЛП, основанный на машинном обучении. Конвейер НЛП — это набор шагов, которые необходимо выполнить для создания комплексного программного обеспечения НЛП.
Он состоит из следующих шагов:
Сбор данных Подготовка текста – Очистка текста – Базовая предварительная обработка – Расширенная предварительная обработка Разработка..
Вопросы по теме 'nltk'
Удалить список стоп-слов из счетчика в python
У меня есть функция в NLTK для создания списка соответствия, который будет выглядеть так:
concordanceList = ["this is a concordance string something",
"this is another concordance string blah"]
и у меня есть еще одна функция,...
4852 просмотров
schedule
30.04.2024
Классификация NLTK и WordNet с текстовым BLOB-объектом
У меня есть следующие два комплекта. Идея состоит в том, чтобы иметь возможность классифицировать новостные статьи на основе нескольких предоставленных мне метатегов. Например, когда я получаю статью, в которой есть «Судья» «5 лет», ее следует...
1580 просмотров
schedule
08.05.2024
AttributeError: объект «модуль» не имеет атрибута «баллы»
Я получаю сообщение об ошибке при попытке использовать функцию precision из nltk.metrics.scores . Я пробовал много разных импортов, но безуспешно.
Я просмотрел файлы в своих каталогах python (см. Ниже), и функция есть, но просто «не могу...
8244 просмотров
schedule
25.03.2024
с NLTK, как я могу создать другую форму слова, когда задано определенное слово?
Например, предположим, что дано слово «счастливый», я хочу сгенерировать другие формы счастья, такие как счастье, счастье... и т. д.
Я прочитал несколько других предыдущих вопросов о ссылках на Stackoverflow и NLTK. Тем не менее, есть только теги...
1658 просмотров
schedule
04.05.2024
Токенизировать с помощью Regex Tokenizer
Я хочу токенизировать следующее предложение с помощью токенизатора регулярных выражений
MOST INTERESTED IN NUT BUTTERS
Когда я определяю свой токенизатор как
tokenizer = RegexpTokenizer(r'\w+')
Я получаю вывод как...
236 просмотров
schedule
09.05.2024