Публикации по теме 'pandas'


TLDR; У меня был действительно сложный расчет, который я не мог понять, как сделать без повторения…
TLDR; У меня был действительно сложный расчет, который я не мог понять, как сделать без перебора строк, поэтому я решил найти эффективный шаблон для перебора и опубликовать его здесь. Привет! Вы абсолютно правы — я понимаю, что не должен был использовать такие простые примеры в этой части, потому что во многих случаях Pandas имеет множество встроенных инструментов, позволяющих выполнять операции без циклов. Если я могу просто выдернуть отрывок из следующей части, которую я написал на..

Анализ данных DineSafe
Исследовательский анализ данных, полученных из системы проверки безопасности пищевых продуктов «DineSafe» города Торонто, и построение прогностической модели. Эта статья на Medium была подготовлена ​​для проекта 2 курса CME538 в Университете Торонто командой SuperANOVA ( Брант Зееман, Джейд Хуанфу, Лумин Хуан, Питер Чен). Все данные и код доступны по адресу: https://github.com/nanonuq/cme538_dinesafe . Фон В 2001 году городские власти Торонто внедрили открытую систему проверки..

Предварительная обработка и обработка данных для науки о данных с использованием Pandas
Изучите фундаментальные концепции, используя pandas DataFrame Введение Одним из наиболее важных этапов перед созданием модели для приложений по обработке и анализу данных является предварительная обработка данных и манипулирование ими. Обычно это включает в себя очистку данных, их форматирование таким образом, чтобы модель могла их интерпретировать, и, возможно, выбор подмножества данных для работы. Этот шаг очень важен, потому что он повлияет на производительность модели, которую..

Категориальное кодирование переменных в Pandas
Три способа кодирования категориальных переменных в Pandas Я нашел три способа кодирования категориальных переменных, используя только функции Pandas. Давайте обсудим один за другим. pd.Categorical(column_name).codes pd.get_dummies (имя_столбца) pd.factorize (имя_столбца) [0] Сначала импортируйте модуль Pandas и обучайте данные import pandas as pd train = pd.read_csv('train.csv') Найдите категориальные переменные из данных поезда. Для выбора категориальных переменных..

Две причины, по которым переименование столбцов не работает в Pandas
Возможно, это относится только к тем, кто приходит на Python из статистического программного обеспечения, но я часто пытался переименовывать столбцы в Pandas, и это не работало, и это также не приводило к каким-либо сообщениям об ошибках. В моем случае проблема обычно заключалась в том, что у Pandas есть настройки по умолчанию, которые противоречат здравому смыслу специалистов по данным. import pandas as pd df = pd.DataFrame(data=[0,1,2], columns=['A']) # Doesn't work df = df.rename({'A':..

Новейшие методы обнаружения аномалий с использованием машинного обучения
Новейшие методы обнаружения аномалий с использованием машинного обучения Что такое обнаружение аномалий? Обнаружение аномалий — это увлекательный метод, который позволяет нам идентифицировать редкие и неожиданные наблюдения или события, которые отклоняются от нормального паттерна. Этот мощный метод использовался в различных приложениях, от обнаружения мошеннических действий до прогнозирования отказов оборудования в сложных промышленных системах. Самый ранний и наиболее..

Анализ Лиги Легенд
League of Legends (LoL) — многопользовательская онлайн-видеоигра, разработанная и изданная Riot Games. Не буду утомлять вас правилами, но по сути это матч 5 на 5, где цель каждой команды — уничтожить базу противоположной команды (красные против синих). Данные, взятые для этого анализа, взяты из Kaggle , что означает, что данные чистые и готовы к анализу. Это несложная проблема, но, поскольку я довольно много играл в эту игру, мне было любопытно, как мои взгляды на игру совпадают с..