Публикации по теме 'statistics'


N02 : Наблюдательные исследования и эксперименты (введение в машинное обучение)
Примечание 02: наблюдательные исследования и эксперименты (введение в машинное обучение) В зависимости от того, на каком этапе цикла PPDAC мы начинаем нашу проблему машинного обучения, вы можете иметь больший или меньший контроль над собираемыми данными. Но где бы вы ни находились в цикле, вы должны учитывать, как собираются данные. Другими словами, мы должны знать больше о том, как было разработано исследование. Чтобы понять качество данных, мы должны знать немного больше о дизайне..

Корреляция между признаками и между признаками | выходная метка, интуиция и реализация
В рамках обучения машинному обучению понимание корреляции между функциями помогает в различных аспектах предварительной обработки данных. Корреляция — это статистическая мера, которая количественно определяет взаимосвязь между двумя переменными. Он показывает, как изменения одной переменной связаны с изменениями другой переменной. Вот преимущества и необходимость корреляционного анализа. 1. Одна переменная может быть причиной или зависеть от значений другой переменной. 2. Одна..

Наивная теорема Байеса
Понимание наивной теоремы Байеса Наивная теорема Байеса Наивная теорема Байеса  – это метод классификации, основанный на теореме Байеса с предположением о независимости предикторов. Проще говоря, наивный байесовский классификатор предполагает, что наличие определенного признака в классе не связано с наличием какого-либо другого признака. Например, фрукт может считаться яблоком , если он красный , круглый и диаметром около 3 дюймов . Даже если эти признаки зависят друг от..

[Обзор статьи] Математика обучения : работа с данными
Моя команда рассматривает «Paper Review» как проект по развитию компетенций. Итак, каждую неделю я буду загружать на Medium как минимум одну публикацию с обзором статьи, название которой начинается с «[Обзор статьи]». Название статьи | Математика обучения: работа с данными Автор | Томасо Поджо и Стив Смейл (MIT Computer Science) Публикация | Уведомления AMS Volume 50, Number 5 Цитата | 698 (Гугл, 12 марта 2023 г.) В статье «Математика обучения: работа с данными» Томазо Поджо..

Уроки статистики не учат вас обращаться с деньгами
Практический первый шаг в проекте по науке о данных Занятия по статистике и науке о данных мало помогают студентам подготовиться к составлению проектных спецификаций на работе. Вот несколько проблем: Они учат вас воспринимать постановку проблемы как должное, но что, если у вашего начальника нет навыков, чтобы делать разумные запросы? Они не учат вас бюджетированию денег и данных, поэтому вы узнаете, как рассчитать идеальные требования к данным, но не думаете о затратах и..

Важна ли математика для науки о данных (DS)?
Data Scientist («Самая сексуальная профессия 21 века») – это профессия, за которой гонятся многие люди с разным уровнем образования (в основном они делятся на инженеров и не инженеров). Все они одинаково сомневаются, МАТЕМАТИКА ДЕЙСТВИТЕЛЬНО ВАЖНА, ЧТОБЫ СТАТЬ УЧЕНЫМ ПО ДАННЫМ? Если да, то какие темы имеют решающее значение для изучения и где я могу найти ресурсы для их изучения? Эта статья в первую очередь предназначена для тех из вас, кто не знает, нужно ли изучать..

PCA- Все, что вы хотите знать!
Анализ главных компонентов (PCA) — это статистический метод, который широко используется для уменьшения размерности больших наборов данных. Цель PCA состоит в том, чтобы определить основную структуру данных, найдя направления максимальной дисперсии, также известные как основные компоненты. Эти основные компоненты используются для преобразования исходных данных в новый набор некоррелированных переменных, называемых оценками основных компонентов. В этой статье мы обсудим теорию и..