Публикации по теме 'statistics'


Все о визуализации данных с помощью Seaborn
Визуализация данных для науки о данных: что и почему? Визуализация данных — это процесс получения статистических данных и размещения их в визуальных факторах, таких как карта или график. Визуализация данных облегчает человеческому мозгу понимание значительных и мелких данных, а визуализация также упрощает восприятие закономерностей, тенденций и выбросов в категориях данных. Визуализация данных важна, потому что визуально представленные числа более привлекательны, когда представляются..

Что, черт возьми, такое «распределение вероятностей»? {Часть-3} Условия для неспециалистов!
После успешного объяснения моих предыдущих 2 частей блогов статистики, здесь я приношу часть 3, которую я считаю настоятельно рекомендуемой на данном этапе после части 2 в это время! и Часть1 , Часть2 — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — Совет для этого блога , сколько много ли нам нужно знать по математике и статистике? Миф: чтобы стать специалистом по данным или инженером по машинному обучению, нужно очень хорошо разбираться в математике и..

R Функция недели: apply() и sapply()
Автор: Неха Анвер , Статистика без границ . Эта статья содержит Краткий обзор концепции apply() и общего варианта использования apply() против sapply() с примерами На этой неделе в Статистика без границ мы рассмотрим концепцию apply() и обсудим, когда ее лучше всего использовать. Во время программирования вы можете столкнуться с ситуациями, требующими перебора набора значений и применения какой-либо функции или вычисления к каждому значению. Традиционно для этого..

Поддержка векторной машины с нуля
Интуитивно понятное введение в машину опорных векторов Машины опорных векторов (SVM) среди классификаторов, вероятно, являются наиболее интуитивно понятными и элегантными, особенно для задач двоичной классификации. Чтобы вы могли понять интуицию, лежащую в основе, я объясню их в среде с двумя классами: вы увидите, что все сказанное будет справедливо также для задач с несколькими классами. Давайте сначала рассмотрим ситуацию, когда наши данные линейно разделимы. Линейно разделяемые..

Спасибо за сообщение. Определенно важное различие, которое необходимо сделать и понять.
Спасибо за сообщение. Определенно важное различие, которое необходимо сделать и понять. Я также недавно писал об этом различии в подробном ответе на этот вопрос, появившемся на Quora: Искусственный интеллект (ИИ) просто прославил статистику ?

[AB-тестирование] Децильный метод для уменьшения дисперсии
Качественный эксперимент — это не только достаточное количество наблюдений, но и данные без шума. Однако часто бывает так, что метрика изначально имеет большую дисперсию. И один из таких примеров — деньги. Одним из самых популярных методов уменьшения дисперсии является удаление выбросов. Однако, когда дело доходит до денег, выбросы крайне редки, как правило, это пользователи, совершающие редкие и крупные транзакции. Просто удалять таких пользователей из выборки в пользу уменьшения..

Прогнозирование цен на автомобили с помощью множественной линейной регрессии и выбора функций
Введение Пандемия, которая продлится до 2021 года, повлияла на уровень производства в автомобильной промышленности и привела к закрытию заводов, ограничению персонала и нехватке критически важных компонентов для современных автомобилей. Это может повлиять на цену самого автомобиля. «Продажи автомобилей упали почти на 20%, но цены бьют рекорды» — The Wall Street Journal, 2020 г. Точная оценка цен на автомобили очень важна для поддержания здорового развития автомобильного рынка...