Публикации по теме 'outliers'


Обнаружение выбросов в предварительной обработке данных
Уровень статьи: средний Мои клиенты часто спрашивают меня об особенностях тех или иных методов предварительной обработки данных, зачем они нужны и когда их использовать. Я расскажу о нескольких распространенных (и не очень) методах предварительной обработки в серии статей на эту тему. В этой серии о предварительной обработке: Стандартизация данных — Краткое объяснение — для начинающих Нормализация данных — Краткое объяснение — для начинающих Горячее кодирование —..

Неконтролируемое обнаружение выбросов с помощью изолированного леса
Изолирующий лес  – неконтролируемый алгоритм обнаружения аномалий, который может обнаруживать выбросы в наборе данных с невероятной скоростью. Изолирующий лес  – это простой, но невероятный алгоритм, способный очень быстро выявлять выбросы или аномалии в наборе данных. Я должен сказать, что понимание этого инструмента является обязательным для любого начинающего специалиста по данным. В этой статье я кратко рассмотрю теории , лежащие в основе алгоритма, а также его реализации..

Вопросы по теме 'outliers'

коробчатые диаграммы с немасштабируемой осью Y
У меня есть некоторые данные, которые я хочу построить. Выбросы (например, 20, 30) слишком далеки от большинства значений (например, 0,0002, 0,0003), и, как следствие, я могу видеть выбросы только при построении графика с помощью matplotlib. Можно...
1148 просмотров
schedule 01.04.2024