Публикации по теме 'statistics'


op #4
op #4 2023–07–06 ПРОДАВАТЬ 186 #MATIC по 0,695 #usd

Причинный вывод с использованием синтетических элементов управления
Как оценить причинно-следственные связи с помощью машинного обучения вместо A/B-тестирования В прошлом году Ксандр стал частью Microsoft, чья миссия состоит в том, чтобы « дать возможность каждому человеку и каждой организации на планете достичь большего ». Для этого нам нужно понять, что заставляет каждого человека и организация успешна в первую очередь. Мы знаем, что каждое изменение, которое мы вносим (в наши продукты или алгоритмы), и любое изменение, вносимое нашими клиентами..

Целевые кодирующие категориальные переменные
Одна хорошая альтернатива горячему кодированию ваших категорий Категориальные переменные являются проблемой для алгоритмов машинного обучения. Поскольку большинство (если не все) из них принимают в качестве входных данных только числовые значения, нам необходимо преобразовать категории в числа, чтобы использовать их в модели. Закодировав их сразу, мы создаем действительно разреженную матрицу и завышаем количество измерений, с которыми должна работать модель, и мы можем стать жертвой..

Линейная классификация в машинном обучении
В предыдущей статье я говорил о линейной регрессии для непрерывных переменных. Как насчет дискретных переменных, эффективна ли для них линейная регрессия? Предположим, я хочу создать спам-фильтр для своей почты, а слова не являются непрерывными, верно? Я хочу различать спам и не спам, чтобы находить спам-сообщения. В литературе по машинному обучению эта дискриминация называется классификацией. Проблемы классификации с двумя классами называются задачами бинарной классификации и..

Начало вашего приключения в науке о данных
несколько списков ресурсов, которые проведут вас по пути науки о данных Путешествие в мир науки о данных одновременно захватывающее и пугающее. Огромный объем знаний, которые необходимо освоить, может показаться ошеломляющим, но не бойтесь! Существует множество ресурсов, которые помогут вам в вашем путешествии, включая бесплатные онлайн-курсы, книги и увлекательные проекты. Сертификационные курсы: Математика и статистика для науки о данных Специализация Математика для..

Анализ индекса Джини: как экономика вдохновила машинное обучение
Как индекс Джини из экономики стал важной концепцией для машинного обучения Фон Индекс Джини — это популярный инструмент в науке о данных, который отвечает за определение того, как разбивается дерево решений. Однако большинство практиков не знают, что индекс Джини изначально был разработан в экономике как мера имущественного неравенства. В этом посте я хочу подробно остановиться на индексе Джини и его происхождении. Что такое индекс Джини? Введенный Коррадо Джини в 1912..

Самые востребованные навыки для специалистов по данным
Что ищут работодатели? Ожидается, что специалисты по данным много знают о машинном обучении, информатике, статистике, математике, визуализации данных, коммуникации и глубоком обучении. В этих областях есть десятки языков, фреймворков и технологий, которым могут научиться специалисты по данным. Как следует тратить бюджет на обучение специалистам по данным, которые хотят, чтобы работодатели пользовались спросом? Я просмотрел веб-сайты со списком вакансий, чтобы определить, какие навыки..