Публикации по теме 'scikit-learn'


Руководство для начинающих по Scikit Learn - реализация Scikit Learn в логистической регрессии
В этой статье мы обсудим обучение Scikit на python. Прежде чем говорить о Scikit learn, нужно понять концепцию машинного обучения. Благодаря машинному обучению вам не нужно собирать информацию вручную. Вам просто нужен алгоритм, а все остальное машина сделает за вас! Разве это не интересно? Scikit learn - одна из достопримечательностей, где мы можем реализовать машинное обучение с использованием Python. Это бесплатная библиотека машинного обучения, которая содержит простые и..

День второй: логистическая регрессия
На второй день я буду внедрять логистическую регрессию, используя научный набор для изучения набора данных от Kaggle, чтобы предсказать вероятность сердечных заболеваний на основе нескольких факторов здоровья людей. Логистическая регрессия — это алгоритм классификации, используемый для прогнозирования класса, к которому принадлежит точка данных, на основе наблюдаемых данных в аналогичном контексте. Категории логистической регрессии могут быть биномиальными (два класса), полиномиальными..

Обработка данных с помощью Pandas; Машинное обучение в реальной жизни
Сегодня мы увидим некоторые важные методы для обработки немного более сложных данных, чем примеры, которые я использовал раньше из sklearn data-set, с использованием различных функций pandas . Этот пост поможет вам организовать сложный набор данных для решения реальных проблем, и в конечном итоге мы рассмотрим пример логистической регрессии данных. Подробнее об очистке данных вы можете прочитать в этом сообщении . Вы можете скачать файл данных из моего репозитория на github под..

Совместимый со Scikit-Learn оценщик KMeans с нуля
В последнее время набирают популярность алгоритмы кластеризации и методы обучения без учителя. Отчасти это связано с экспоненциальным увеличением объема генерируемых данных, а также с тем, что метки для этих данных часто все еще трудно найти. Маркировка данных может занимать много времени и требует человеческих усилий, которые могут быть дорогостоящими. Методы обучения без учителя — это методы машинного обучения, которые можно использовать для извлечения информации из немаркированных..

Категориальные переменные и ColumnTransformer в scikit-learn
Конвейеры Sklearn - отличный инструмент, гарантирующий, что предварительная обработка данных станет реальной и последовательной частью обучения вашей модели и будет применяться во время прогнозирования. Однако этот процесс становится немного сложным, когда у нас есть разные типы переменных в данных, такие как непрерывный возраст, а также название должности. Сегодня давайте рассмотрим процесс настройки конвейера, который может предварительно обрабатывать различные типы переменных..

Введение в пайплайны Scikit-learn
Построение сквозного конвейера машинного обучения с использованием scikit-learn Попытка решить проблему машинного обучения, как правило, довольно повторяющаяся задача, когда речь идет о процессах, которым мы должны следовать. Вообще говоря, когда мы хотим решить проблему регрессии или классификации в табличных данных, мы делаем три шага: Читать данные из источника Предварительно обработайте данные различными способами Подача модели с предварительно обработанными данными В этой..

ДЕРЕВО РЕШЕНИЙ И СЛУЧАЙНЫЙ ЛЕС (Легкий способ)
Дерево решений — это форма контролируемого обучения, в которой вы даете ему некоторые образцы данных и результирующие классификации, и получается дерево! Он дает вам блок-схему, которая поможет вам выбрать классификацию для чего-то с машинным обучением. Так, например, вот зависимая переменная Погода, и на ее основе я решаю, иду ли я играть или нет: Итак, как вы можете видеть, DT может смотреть на различные атрибуты погоды (такие как влажность, температура, дождь и т. д.) и..