Необходимы ли удаление стоп-слов, стемминг и лемматизация для классификации текста при использовании Spacy, Bert или других продвинутых моделей НЛП для получения векторного встраивания текста?
text = Еда на свадьбе была очень вкусной
1. с тех пор, как Spacy, Берт обучался работе с огромными необработанными наборами данных, есть ли какие-либо преимущества применения удаления стоп-слов, стемминга и лемматизации для этого текста перед генерацией встраивания с использованием bert / spacy для задачи классификации текста?
2. Я понимаю, что удаление стоп-слов, стемминг и лемматизация будут хорошими, когда мы будем использовать countvectorizer, tfidf векторизатор для встраивания предложений.