Вопросы по теме 'dataframe'
Панды Python, как усечь DatetimeIndex и заполнить недостающие данные только через определенный интервал
2012-10-08 07:12:22 0.0 0 0 2315.6 0 0.0 0
2012-10-08 09:14:00 2306.4 20 326586240 2306.4 472 2306.8 4
2012-10-08 09:15:00 2306.8 34 249805440 2306.8 361 2308.0 26
2012-10-08...
2981 просмотров
schedule
25.03.2024
DataFrame из массива с заголовком
У меня есть массив со строкой заголовка:
arr = ["age" "height" "weight";
20 175 73;
30 160 66]
и я хочу преобразовать его в DataFrame, какой рекомендуемый метод? Мой текущий метод - это ответ ниже, есть ли...
836 просмотров
schedule
18.03.2024
cbind два списка data.frames в новый список
У меня есть два списка data.frames. Оба списка имеют одинаковую длину и содержат подходящие кадры данных в соответствующих элементах списка. Итак, сценарий выглядит так
dfa = data.frame(a=1:3, b = letters[1:3])
dfb = data.frame(x=runif(3))
a =...
6721 просмотров
schedule
29.04.2024
использование интервалов для присвоения категориальных значений
Возьмите следующие общие данные
A <- c(5,7,11,10,23,30,24,6)
B <- c(1,2,3,1,2,3,1,2)
C <- data.frame(A,B)
и следующие интервалы
library(intervals)
interval1 <- Intervals(
matrix(
c(
5, 15,
15, 25,
25,...
501 просмотров
schedule
25.03.2024
Как я могу изменить имя фрейма данных
У меня возникает повторяющаяся ситуация, когда я устанавливаю значение вверху длинного набора кода R, который используется для подмножества одного или нескольких кадров данных. Что-то вроде этого:
city_code <- "202"
В конце всего процесса...
106333 просмотров
schedule
02.06.2024
Как удалить столбец в кадре данных pandas на основе условия?
У меня есть pandas DataFrame со многими значениями NAN .
Как я могу удалить такие столбцы, что number_of_na_values > 2000 ?
Я пытался сделать это так:
toRemove = set()
naNumbersPerColumn = df.isnull().sum()
for i in...
38508 просмотров
schedule
15.03.2024
R применяет возвращаемые строки, но хочет столбцы
Я пытаюсь очистить данные опроса, где иногда информация о минутах вводится в поле часов. В правилах очистки указано переместить значение часов в поле минут, если минуты отсутствуют или равны 0, а часы равны 15, 30, 45 или 60.
Вот функция, которую...
32 просмотров
schedule
07.03.2024
Программно нарезать кадр данных Pandas на месте
У меня есть куча фреймов данных, которые я пытаюсь нарезать и присвоить исходным именам. Но я обнаружил, что есть проблема с пространством имен. Ниже то, что у меня есть.
import pandas as pd
import numpy as np
df_a =...
1664 просмотров
schedule
09.03.2024
Python Pandas: невозможно индексировать слайсы
Я пытаюсь работать с мультииндексным фреймом данных pandas, который выглядит так:
end ref|alt
chrom start
chr1 3000714 3000715 T|G
3001065 3001066 G|T
3001110 3001111 G|C
3001131 3001132...
6617 просмотров
schedule
16.05.2024
Как установить/получить pandas.DataFrame в/из Redis?
После установки DataFrame на redis, а затем его возврата, redis возвращает строку, и я не могу найти способ преобразовать эту строку в DataFrame.
Как я могу сделать эти два правильно?
20406 просмотров
schedule
31.05.2024
Как сохранить фрейм данных в HBase?
У меня есть df со схемой, также создайте таблицу в HBase с помощью phoenix. Я хочу сохранить этот df в HBase с помощью spark. Я попробовал описания в следующей ссылке и запустил искровую оболочку с зависимостями плагина phoenix.
spark-shell...
1597 просмотров
schedule
30.04.2024
Вычтите даты, если индексы совпадают друг с другом в Python Pandas
У меня есть два фрейма данных:
print (df1)
ID Birthday
0 A000 1990-01-01
1 A001 1991-05-05
2 A002 1970-10-01
3 A003 1980-07-07
4 A004 1945-08-15
print (df2)
ID Date from
0 A000 2010.01
1 A001...
126 просмотров
schedule
21.05.2024
Создание HDF5 из нескольких кадров данных панды
У меня есть 100 фреймов данных panda, хранящихся в файлах .pkl в каталоге на моем компьютере. Я хочу просмотреть все кадры данных и сохранить их все в 1 файле HDF5. Я планировал сохранить все кадры данных в 1 файле рассола, но я слышал, что HDF5...
2601 просмотров
schedule
25.03.2024
Есть ли более быстрый способ сделать массовую вставку ядра Sqlalchemy?
Теперь я прочитал об этой массовой вставке в документации по sqlalchemy, но для моего приложения это может занять больше времени, чем должно!
Сначала я покажу вам, как я это делаю:
def insert_all(self, table_name, schema_name, df):
if not...
655 просмотров
schedule
02.06.2024
новый столбец с порядковым номером в пандах, условно увеличенный
Вопрос:
Учитывая кадр данных с такими данными:
>>> df
data
0 START
1 blah
2 blah
3 blah
4 blah
5 END
6 START
7 blah
8 blah
9 END
Каков наиболее эффективный способ назначить новый столбец с порядковым...
155 просмотров
schedule
12.03.2024
R Как с оператором ifelse извлечь значение из другого столбца, если условие истинно?
Вероятно, для этого есть простое решение, но я всю ночь пытался получить это, и я не могу найти правильные условия поиска, чтобы найти ответ, поэтому я ценю любую помощь.
По сути, я заполняю новый кадр данных, ища имя строк в другом кадре данных2,...
1223 просмотров
schedule
17.03.2024
Назначьте диапазоны ведер в степени 2 в отдельном столбце в пандах
У меня есть столбец значений, как показано ниже:
col
12
76
34
для которого мне нужно создать новый столбец с метками корзины для col1 , как указано ниже:
col1 bucket-labels
12 8-16
76 64-128
34...
239 просмотров
schedule
19.05.2024
Вычтите 2 фрейма данных pyspark на основе столбца
У меня есть 2 фрейма данных pyspark,
i
+---+-----+
| ID|COL_A|
+---+-----+
| 1| 123|
| 2| 456|
| 3| 111|
| 4| 678|
+---+-----+
j
+----+-----+
|ID_B|COL_B|
+----+-----+
| 2| 456|
| 3| 111|
| 4| 876|
+----+-----+
Я пытаюсь...
3093 просмотров
schedule
06.05.2024
Маска кадра данных с другой мультииндексированной серией
У меня есть Dataframe, который я хотел бы замаскировать (преобразовать в NaN) с помощью логических значений мультииндексированной серии, где мультииндекс серии также является именами столбцов в Dataframe. Например, если df :
df = pd.DataFrame({...
125 просмотров
schedule
15.04.2024
Сдвиг значений в кадре данных python
У меня следующая проблема. Мне нужно сместить значения в кадре данных (python) влево, если некоторые ячейки пусты. Итак, если у меня есть кадр данных
col1 col2 col3 col4
0 A B D
1 C E E A
2 E A E A
3 A...
69 просмотров
schedule
29.05.2024