Публикации по теме sklearn

Публикации по теме 'sklearn'

Использование кодировщика меток для несбалансированных категориальных данных в машинном обучении с использованием Python

Привет всем, поскольку мы все знаем, что сбор данных считается одной из самых важных задач в машинном обучении. Кодирование данных в основном происходит непосредственно перед тем, как данные могут быть переданы в алгоритм машинного обучения. Для этого уже известны и широко используются различные методы кодирования, такие как OneHot Encoder, Label Encoder и get_dummies. Одной из проблем с несбалансированными данными, с которыми я лично столкнулся, является введение новых категорий..

Naked DataScience Day – 32 (InceptionNet: раскрытие возможностей многоотраслевых архитектур)

Введение: Глубокое обучение стало свидетелем замечательных достижений в последние годы благодаря разработке сложных архитектур нейронных сетей, которые раздвигают границы производительности. Одной из таких новаторских архитектур является InceptionNet, также известная как GoogLeNet. В этом сообщении блога мы рассмотрим архитектуру InceptionNet, поймем ее уникальные принципы проектирования, углубимся в концепцию начальных модулей и предоставим практическую реализацию кода с использованием..

Масштабирование нескольких типов данных с помощью SKLearn

Масштабирование данных — необходимый и прямой процесс в самых простых ситуациях, но в жизни нет ничего по-настоящему простого. В этой статье будет показано, как масштабировать несколько типов данных при использовании перекрестной проверки. Давайте погрузимся! Давайте сначала начнем с того, что такое масштабирование и зачем нам нужно масштабировать наши данные? Масштабирование помещает значения наших данных в диапазон либо от 0 до 1, либо от -1 до +1, сохраняя при этом форму..

Наука, стоящая за ансамблевым обучением

Создание нескольких моделей машинного обучения и сравнение их точности может быть утомительным и занимать много времени, если проблема немного сложна. К счастью, у нас есть ансамблевые алгоритмы обучения, которые облегчают эту задачу специалистам по данным. Как следует из названия, алгоритмы ансамблевого обучения обучают группу моделей одному и тому же набору данных и объединяют их прогнозы, чтобы получить более надежный прогноз, менее подверженный ошибкам. Давайте разберемся в..

Искусство косинусного подобия

Косинусное сходство — это математическое понятие, которое помогает нам определить меру сходства между объектами . Любовь — это способность видеть сходство в непохожем. - Теодор В. Адорно Математика Здесь A, B — два вектора в многомерном пространстве, и решение приведенного выше уравнения будет лежать в диапазоне [-1,1]: 1 : Высокое сходство 0 -1 : Нет сходства Проще говоря, по мере того, как угол 𝜭 становится меньше, сходство косинусов приближается к 1. Тот сериал,..

Практическое машинное обучение, второе издание Орельена Жерона

Краткий вызов Введение Привет, меня зовут Билли, и я собираюсь прочитать «Практическое машинное обучение с помощью Scikit-Learn, Keras и TensorFlow: концепции, инструменты и методы создания интеллектуальных систем» Орельена Герона. Моя цель Я предлагаю эту задачу: читать по одной главе в день, чтобы удержаться от чтения довольно сложной книги. Книга состоит из 19 глав и содержит около 750 страниц содержания. Я надеюсь закончить всю книгу за 19 дней, но на самом деле я даю себе..

Использование категориальных данных в качестве числовых данных для машинного обучения

Допустим, мы работаем над моделью линейной регрессии (LR), где нам нужно обрабатывать категориальные данные в качестве входных данных. Например, прогнозирование цены автомобиля, где важны такие атрибуты, как название модели или марки. Обработка данных перед их подачей в модель машинного обучения (ML) является одним из наиболее важных этапов в процессе обучения модели. Без надлежащей предварительной обработки данных не имеет значения, насколько продвинута наша модель, в конечном итоге она..