Публикации по теме 'pandas'


Категориальное кодирование переменных в Pandas
Три способа кодирования категориальных переменных в Pandas Я нашел три способа кодирования категориальных переменных, используя только функции Pandas. Давайте обсудим один за другим. pd.Categorical(column_name).codes pd.get_dummies (имя_столбца) pd.factorize (имя_столбца) [0] Сначала импортируйте модуль Pandas и обучайте данные import pandas as pd train = pd.read_csv('train.csv') Найдите категориальные переменные из данных поезда. Для выбора категориальных переменных..

Две причины, по которым переименование столбцов не работает в Pandas
Возможно, это относится только к тем, кто приходит на Python из статистического программного обеспечения, но я часто пытался переименовывать столбцы в Pandas, и это не работало, и это также не приводило к каким-либо сообщениям об ошибках. В моем случае проблема обычно заключалась в том, что у Pandas есть настройки по умолчанию, которые противоречат здравому смыслу специалистов по данным. import pandas as pd df = pd.DataFrame(data=[0,1,2], columns=['A']) # Doesn't work df = df.rename({'A':..

Новейшие методы обнаружения аномалий с использованием машинного обучения
Новейшие методы обнаружения аномалий с использованием машинного обучения Что такое обнаружение аномалий? Обнаружение аномалий — это увлекательный метод, который позволяет нам идентифицировать редкие и неожиданные наблюдения или события, которые отклоняются от нормального паттерна. Этот мощный метод использовался в различных приложениях, от обнаружения мошеннических действий до прогнозирования отказов оборудования в сложных промышленных системах. Самый ранний и наиболее..

Анализ Лиги Легенд
League of Legends (LoL) — многопользовательская онлайн-видеоигра, разработанная и изданная Riot Games. Не буду утомлять вас правилами, но по сути это матч 5 на 5, где цель каждой команды — уничтожить базу противоположной команды (красные против синих). Данные, взятые для этого анализа, взяты из Kaggle , что означает, что данные чистые и готовы к анализу. Это несложная проблема, но, поскольку я довольно много играл в эту игру, мне было любопытно, как мои взгляды на игру совпадают с..

Как преобразовать Pandas DataFrame в массив NumPy
Преобразование кадра данных pandas в массив NumPy Введение При работе с pandas DataFrames иногда может быть полезно преобразовать их в массивы NumPy. Последнее кажется более эффективным с точки зрения памяти, особенно когда речь идет о выполнении некоторых сложных математических операций над данными. Это особенно актуально, когда вы работаете с относительно небольшими объемами данных (скажем, 50 тысяч строк или меньше). Pandas обычно превосходит ndarray в случаях, когда требуется..

3 простых способа сравнить два кадра данных Pandas
Наука о данных 3 простых способа сравнить два кадра данных Pandas Быстро узнайте, как найти общие и необычные строки между двумя пандами DataFrames. Это простая задача — если вы используете встроенные методы в pandas. В Python Pandas DataFrame — это простейшая структура данных, в которой вы можете хранить данные в табличной форме, т. е. в виде строк и столбцов, и работать с ними, чтобы получить полезную информацию. При работе с реальными сценариями одна из распространенных..

P для власти. P для панд. И P для pyplot
Мы все знаем, что для ученого данных Pandas — это сила. Если нет, вы должны пойти и проверить мой предыдущий пост о силе панд . Сегодня мы проверим, как мы можем преобразовать эту мощь в визуализацию с помощью pyplot. Когда мы изучаем данные, иногда бывает очень удобно представить результаты в визуальном виде. Кто-то правильно сказал — «Картинка стоит тысячи слов». Визуализация позволяет чрезвычайно легко показать тенденции в данных. Если вы попытаетесь представить аналогичные данные..