Публикации по теме 'outliers'
Обнаружение выбросов в предварительной обработке данных
Уровень статьи: средний
Мои клиенты часто спрашивают меня об особенностях тех или иных методов предварительной обработки данных, зачем они нужны и когда их использовать. Я расскажу о нескольких распространенных (и не очень) методах предварительной обработки в серии статей на эту тему.
В этой серии о предварительной обработке:
Стандартизация данных — Краткое объяснение — для начинающих Нормализация данных — Краткое объяснение — для начинающих Горячее кодирование —..
Неконтролируемое обнаружение выбросов с помощью изолированного леса
Изолирующий лес – неконтролируемый алгоритм обнаружения аномалий, который может обнаруживать выбросы в наборе данных с невероятной скоростью.
Изолирующий лес – это простой, но невероятный алгоритм, способный очень быстро выявлять выбросы или аномалии в наборе данных. Я должен сказать, что понимание этого инструмента является обязательным для любого начинающего специалиста по данным. В этой статье я кратко рассмотрю теории , лежащие в основе алгоритма, а также его реализации..
Вопросы по теме 'outliers'
коробчатые диаграммы с немасштабируемой осью Y
У меня есть некоторые данные, которые я хочу построить. Выбросы (например, 20, 30) слишком далеки от большинства значений (например, 0,0002, 0,0003), и, как следствие, я могу видеть выбросы только при построении графика с помощью matplotlib.
Можно...
1148 просмотров
schedule
01.04.2024