Публикации по теме 'scikit-learn'


Настройка конвейеров Scikit-Learn: напишите свой собственный преобразователь
Как использовать пайплайны и добавлять пользовательские преобразователи в поток обработки Ищете способ организовать поток машинного обучения, сохраняя при этом гибкость процесса обработки? Хотите работать с конвейерами, добавляя уникальные этапы обработки данных? Эта статья представляет собой простое пошаговое руководство по использованию пайплайнов Scikit-Learn и добавлению в пайплайн пользовательских преобразователей. Почему трубопроводы? Если вы достаточно долго работаете..

Простой способ обнаружить аномалию
Когда количество наблюдений в одном классе намного больше, чем в другом, трудно обучить обычный классификатор CNN. Классификатор CNN может считать, что все наблюдения относятся к основному классу для достижения высокой точности. Один из способов решения этой проблемы - использовать передискретизацию или понижающую дискретизацию для уравновешивания данных. Кроме того, отличной идеей является корректировка весов классов, чтобы заставить классификатор обрабатывать данные в редком классе...

Машинное обучение с помощью Scikit-Learn: практическое руководство
Scikit-Learn — одна из самых популярных и широко используемых библиотек машинного обучения в Python. Он предоставляет простой и эффективный способ реализации различных алгоритмов машинного обучения и выполнения таких задач, как классификация, регрессия, кластеризация и т. д. В этом подробном руководстве мы рассмотрим основные понятия и шаги, которые помогут вам начать работу с машинным обучением с помощью Scikit-Learn. Оглавление 1. Введение в Scikit-Learn 2. Установка 3...

Краткое введение в конвейеры SciKit
И почему вам стоит начать их использовать. Вы когда-нибудь обучали модель машинного обучения, и ваши прогнозы выглядели слишком хорошо, чтобы быть правдой? Но потом вы поняли, что между данными обучения и тестирования произошла некоторая утечка данных? Или у вас было много этапов предварительной обработки для подготовки данных, поэтому было трудно перенести этапы предварительной обработки из обучения модели в производство для получения реальных прогнозов? Или ваша предварительная..

Извлечение деревьев из моделей GBM в виде фреймов данных
Популярные библиотеки Python для моделей GBM в основном используют свои API, но они не идентичны. В этой статье я сосредоточусь на методах, используемых для извлечения отдельных деревьев решений из этих моделей. Сначала я представляю нативные, специфичные для пакетов решения для этого. В конце я представляю новый общий интерфейс, который позволяет нам экспортировать древовидные структуры из произвольных древовидных моделей GBM. СветGBM Я начинаю с LightGBM , который предоставляет..

Scikit-Learn: мощная библиотека для анализа данных и машинного обучения
С помощью scikit-learn вы можете легко создавать и запускать сложные модели машинного обучения. Эта библиотека идеально подходит для обучения анализу данных, что делает ее идеальным выбором для занятых профессионалов, которым необходимо разобраться в науке о данных.

5 пакетов Python, без которых специалист по данным не может жить
5 пакетов Python, без которых специалист по данным не может жить Вводный обзор Python - это язык общего назначения, и поэтому он предлагает большое количество расширений, которые варьируются от научного программирования до визуализации данных, от статистических инструментов до машинного обучения. Практически невозможно узнать все доступные расширения, однако есть несколько из них, которые имеют решающее значение, если ваша задача состоит в анализе данных и построении на них моделей..