Публикации по теме 'data-preprocessing'


Изображение и соответствующее вращение метки с использованием Python
Я хотел бы предоставить небольшую предысторию, прежде чем углубляться в тему, чтобы предложить лучшее понимание. Во время летней стажировки я столкнулся с тривиальной, но сложной задачей. Я работаю с изображениями, метки которых представляют собой координаты 4 точек, ограничивающих многоугольник (псевдопрямоугольник) в данном изображении {( x₁ , y₁ ), ( x ₂, y ₂), ( x ₃, y ₃), ( x ₄, г ₄)}. Изображения, используемые в этой статье, не являются настоящими паспортами; они предназначены..

Каковы методы преобразования признаков?
Экскурсия по методам преобразования признаков Согласно исследованию Gartner, 87% проектов по науке о данных никогда не запускаются в производство. И снова исследования показывают, что подготовка набора данных для модели — самая трудоемкая задача (80%). Кажется, что самая ответственная и сложная часть проекта — это подготовительная часть. Здесь вложено много усилий, потрачено время, но результат зачастую недостаточно хорош для запуска в производство. По словам Педро Домингоса,..

Подготовка данных, где взять список всех акций NYSE и NASDAQ (drl4t-03)
Ключом к машинному обучению являются данные. Чтобы обучить модель машинного обучения прогнозированию торговых тенденций, нам необходимо получить как можно больше исторических торговых данных. Официальный веб-сайт NASDAQ предоставляет надежный и бесплатный ресурс на странице проверки акций, которая позволяет вам получить полный список акций, торгуемых на всех трех основных фондовых биржах: NASDAQ, NYSE и AMEX. Вы можете получить доступ к странице, используя этот URL:..

Раскрытие возможностей НЛП: глубокое погружение в этапы предварительной обработки текста
Конвейер НЛП Прежде чем перейти к этапам предварительной обработки текста в обработке естественного языка (NLP), давайте взглянем на стандартный конвейер НЛП, основанный на машинном обучении. Конвейер НЛП — это набор шагов, которые необходимо выполнить для создания комплексного программного обеспечения НЛП. Он состоит из следующих шагов: Сбор данных Подготовка текста – Очистка текста – Базовая предварительная обработка – Расширенная предварительная обработка Разработка..