Вопросы по теме 'dataframe'

Панды Python, как усечь DatetimeIndex и заполнить недостающие данные только через определенный интервал
2012-10-08 07:12:22 0.0 0 0 2315.6 0 0.0 0 2012-10-08 09:14:00 2306.4 20 326586240 2306.4 472 2306.8 4 2012-10-08 09:15:00 2306.8 34 249805440 2306.8 361 2308.0 26 2012-10-08...
2981 просмотров
schedule 25.03.2024

DataFrame из массива с заголовком
У меня есть массив со строкой заголовка: arr = ["age" "height" "weight"; 20 175 73; 30 160 66] и я хочу преобразовать его в DataFrame, какой рекомендуемый метод? Мой текущий метод - это ответ ниже, есть ли...
836 просмотров
schedule 18.03.2024

cbind два списка data.frames в новый список
У меня есть два списка data.frames. Оба списка имеют одинаковую длину и содержат подходящие кадры данных в соответствующих элементах списка. Итак, сценарий выглядит так dfa = data.frame(a=1:3, b = letters[1:3]) dfb = data.frame(x=runif(3)) a =...
6721 просмотров
schedule 29.04.2024

использование интервалов для присвоения категориальных значений
Возьмите следующие общие данные A <- c(5,7,11,10,23,30,24,6) B <- c(1,2,3,1,2,3,1,2) C <- data.frame(A,B) и следующие интервалы library(intervals) interval1 <- Intervals( matrix( c( 5, 15, 15, 25, 25,...
501 просмотров
schedule 25.03.2024

Как я могу изменить имя фрейма данных
У меня возникает повторяющаяся ситуация, когда я устанавливаю значение вверху длинного набора кода R, который используется для подмножества одного или нескольких кадров данных. Что-то вроде этого: city_code <- "202" В конце всего процесса...
106333 просмотров
schedule 02.06.2024

Как удалить столбец в кадре данных pandas на основе условия?
У меня есть pandas DataFrame со многими значениями NAN . Как я могу удалить такие столбцы, что number_of_na_values > 2000 ? Я пытался сделать это так: toRemove = set() naNumbersPerColumn = df.isnull().sum() for i in...
38508 просмотров
schedule 15.03.2024

R применяет возвращаемые строки, но хочет столбцы
Я пытаюсь очистить данные опроса, где иногда информация о минутах вводится в поле часов. В правилах очистки указано переместить значение часов в поле минут, если минуты отсутствуют или равны 0, а часы равны 15, 30, 45 или 60. Вот функция, которую...
32 просмотров
schedule 07.03.2024

Программно нарезать кадр данных Pandas на месте
У меня есть куча фреймов данных, которые я пытаюсь нарезать и присвоить исходным именам. Но я обнаружил, что есть проблема с пространством имен. Ниже то, что у меня есть. import pandas as pd import numpy as np df_a =...
1664 просмотров
schedule 09.03.2024

Python Pandas: невозможно индексировать слайсы
Я пытаюсь работать с мультииндексным фреймом данных pandas, который выглядит так: end ref|alt chrom start chr1 3000714 3000715 T|G 3001065 3001066 G|T 3001110 3001111 G|C 3001131 3001132...
6617 просмотров
schedule 16.05.2024

Как установить/получить pandas.DataFrame в/из Redis?
После установки DataFrame на redis, а затем его возврата, redis возвращает строку, и я не могу найти способ преобразовать эту строку в DataFrame. Как я могу сделать эти два правильно?
20406 просмотров
schedule 31.05.2024

Как сохранить фрейм данных в HBase?
У меня есть df со схемой, также создайте таблицу в HBase с помощью phoenix. Я хочу сохранить этот df в HBase с помощью spark. Я попробовал описания в следующей ссылке и запустил искровую оболочку с зависимостями плагина phoenix. spark-shell...
1597 просмотров
schedule 30.04.2024

Вычтите даты, если индексы совпадают друг с другом в Python Pandas
У меня есть два фрейма данных: print (df1) ID Birthday 0 A000 1990-01-01 1 A001 1991-05-05 2 A002 1970-10-01 3 A003 1980-07-07 4 A004 1945-08-15 print (df2) ID Date from 0 A000 2010.01 1 A001...
126 просмотров
schedule 21.05.2024

Создание HDF5 из нескольких кадров данных панды
У меня есть 100 фреймов данных panda, хранящихся в файлах .pkl в каталоге на моем компьютере. Я хочу просмотреть все кадры данных и сохранить их все в 1 файле HDF5. Я планировал сохранить все кадры данных в 1 файле рассола, но я слышал, что HDF5...
2601 просмотров
schedule 25.03.2024

Есть ли более быстрый способ сделать массовую вставку ядра Sqlalchemy?
Теперь я прочитал об этой массовой вставке в документации по sqlalchemy, но для моего приложения это может занять больше времени, чем должно! Сначала я покажу вам, как я это делаю: def insert_all(self, table_name, schema_name, df): if not...
655 просмотров
schedule 02.06.2024

новый столбец с порядковым номером в пандах, условно увеличенный
Вопрос: Учитывая кадр данных с такими данными: >>> df data 0 START 1 blah 2 blah 3 blah 4 blah 5 END 6 START 7 blah 8 blah 9 END Каков наиболее эффективный способ назначить новый столбец с порядковым...
155 просмотров
schedule 12.03.2024

R Как с оператором ifelse извлечь значение из другого столбца, если условие истинно?
Вероятно, для этого есть простое решение, но я всю ночь пытался получить это, и я не могу найти правильные условия поиска, чтобы найти ответ, поэтому я ценю любую помощь. По сути, я заполняю новый кадр данных, ища имя строк в другом кадре данных2,...
1223 просмотров
schedule 17.03.2024

Назначьте диапазоны ведер в степени 2 в отдельном столбце в пандах
У меня есть столбец значений, как показано ниже: col 12 76 34 для которого мне нужно создать новый столбец с метками корзины для col1 , как указано ниже: col1 bucket-labels 12 8-16 76 64-128 34...
239 просмотров
schedule 19.05.2024

Вычтите 2 фрейма данных pyspark на основе столбца
У меня есть 2 фрейма данных pyspark, i +---+-----+ | ID|COL_A| +---+-----+ | 1| 123| | 2| 456| | 3| 111| | 4| 678| +---+-----+ j +----+-----+ |ID_B|COL_B| +----+-----+ | 2| 456| | 3| 111| | 4| 876| +----+-----+ Я пытаюсь...
3093 просмотров

Маска кадра данных с другой мультииндексированной серией
У меня есть Dataframe, который я хотел бы замаскировать (преобразовать в NaN) с помощью логических значений мультииндексированной серии, где мультииндекс серии также является именами столбцов в Dataframe. Например, если df : df = pd.DataFrame({...
125 просмотров

Сдвиг значений в кадре данных python
У меня следующая проблема. Мне нужно сместить значения в кадре данных (python) влево, если некоторые ячейки пусты. Итак, если у меня есть кадр данных col1 col2 col3 col4 0 A B D 1 C E E A 2 E A E A 3 A...
69 просмотров
schedule 29.05.2024