Вопросы с тегом «pandas»

102
удаление строк из фрейма данных на основании условия «не в» [дубликат]

На этот вопрос уже есть ответы здесь : Как отфильтровать фрейм данных Pandas, используя 'in' и 'not in', как в SQL (8 ответов) Закрыт 6 месяцев назад . Я хочу удалить строки из фрейма данных pandas, когда значение столбца даты находится в списке дат. Следующий код не работает: a=['2015-01-01' ,...

102
Как выбрать строки в DataFrame между двумя значениями в Python Pandas?

Я пытаюсь изменить DataFrame, dfчтобы он содержал только строки, для которых значения в столбце closing_priceнаходятся между 99 и 101, и пытаюсь сделать это с помощью приведенного ниже кода. Однако я получаю сообщение об ошибке ValueError: значение истинности Серии неоднозначно. Используйте...

102
Столбец биннинга с пандами python

У меня есть столбец Data Frame с числовыми значениями: df['percentage'].head() 46.5 44.2 100.0 42.12 Я хочу видеть столбец как количество мусорных корзин: bins = [0, 1, 5, 10, 25, 50, 100] Как я могу получить результат в виде закромок со своими value counts? [0, 1] bin amount [1, 5] etc [5, 10]...

101
Как сдвинуть столбец в Pandas DataFrame

Я хотел бы переместить столбец в пандах DataFrame, но мне не удалось найти способ сделать это из документации, не переписав весь DF. Кто-нибудь знает как это делать? DataFrame: ## x1 x2 ##0 206 214 ##1 226 234 ##2 245 253 ##3 265 272 ##4 283 291 Желаемый результат: ## x1 x2 ##0 206 nan ##1 226 214...

101
Как я могу фильтровать строки при загрузке в функции Pandas read_csv?

Как я могу отфильтровать, какие строки CSV должны быть загружены в память с помощью pandas? Похоже, это вариант, который стоит найти read_csv. Я что-то упускаю? Пример: у нас есть CSV со столбцом с меткой времени, и мы хотим загрузить только те строки, метка времени которых больше заданной...

101
Выбор столбца панд по местоположению

Я просто пытаюсь получить доступ к именованным столбцам панд целым числом. Вы можете выбрать строку по местоположению с помощью df.ix[3]. Но как выбрать столбец целым числом? Мой фрейм данных: df=pandas.DataFrame({'a':np.random.rand(5), 'b':np.random.rand(5)})...

101
Способ чтения первых нескольких строк для фрейма данных pandas

Есть ли встроенный способ использовать read_csvдля чтения только первых nстрок файла, не зная заранее длины строк? У меня есть большой файл, чтение которого занимает много времени, и иногда я хочу использовать только первые, скажем, 20 строк, чтобы получить его образец (и предпочитаю не загружать...

101
Добавить столбец с количеством дней между датами в пандах DataFrame

Я хочу вычесть даты в «A» из дат в «B» и добавить новый столбец с разницей. df A B one 2014-01-01 2014-02-28 two 2014-02-03 2014-03-01 Я пробовал следующее, но получаю сообщение об ошибке, когда пытаюсь включить это в цикл for ... import datetime date1=df['A'][0] date2=df['B'][0] mdate1 =...

100
Pandas: создайте два новых столбца в фрейме данных со значениями, вычисленными из уже существующего столбца

Я работаю с библиотекой pandas и хочу добавить два новых столбца в фрейм данных dfс n столбцами (n> 0). Эти новые столбцы являются результатом применения функции к одному из столбцов во фрейме данных. Применяемая функция выглядит так: def calculate(x): ...operate... return z, y Один из способов...

100
Создание нового столбца на основе условия if-elif-else

У меня есть DataFrame df: A B a 2 2 b 3 1 c 1 3 Я хочу создать новый столбец на основе следующих критериев: если строка A == B: 0 если строкаA > B: 1 если строка A < B: -1 поэтому, учитывая приведенную выше таблицу, это должно быть: A B C a 2 2 0 b 3 1 1 c 1 3 -1 Для типичных if elseслучаев,...

100
FutureWarning: поэлементное сравнение не выполнено; возвращает скаляр, но в дальнейшем будет выполнять поэлементное сравнение

Я использую Pandas 0.19.1на Python 3. Я получаю предупреждение об этих строках кода. Я пытаюсь получить список, содержащий все номера строк, в которых строка Peterприсутствует в столбце Unnamed: 5. df = pd.read_excel(xls_path) myRows = df[df['Unnamed: 5'] == 'Peter'].index.tolist() Выдает...

99
GroupBy pandas DataFrame и выберите наиболее распространенное значение

У меня есть фрейм данных с тремя строковыми столбцами. Я знаю, что единственное значение в 3-м столбце действительно для каждой комбинации первых двух. Чтобы очистить данные, мне нужно сгруппировать данные по фреймам по первым двум столбцам и выбрать наиболее распространенное значение третьего...

99
Как импортировать данные из mongodb в pandas?

У меня есть большой объем данных в коллекции в mongodb, которые мне нужно проанализировать. Как мне импортировать эти данные в панды? Я новичок в pandas и numpy. РЕДАКТИРОВАТЬ: коллекция mongodb содержит значения датчиков, помеченные датой и временем. Значения датчиков имеют тип данных float....

99
Преобразование DateTimeIndex с учетом часового пояса pandas в наивную метку времени, но в определенном часовом поясе

Вы можете использовать эту функцию, tz_localizeчтобы сделать отметку времени или DateTimeIndex осведомленной о часовом поясе, но как вы можете сделать обратное: как вы можете преобразовать временную метку, учитывающую часовой пояс, в наивную, сохраняя при этом часовой пояс? Пример: In [82]: t =...

99
Пропустить строки во время импорта csv pandas

Я пытаюсь импортировать файл .csv pandas.read_csv(), но не хочу импортировать вторую строку файла данных (строку с индексом = 1 для 0-индексации). Я не понимаю, как не импортировать его, потому что аргументы, используемые с командой, кажутся неоднозначными: С сайта панд: skiprows : список или...

98
pandas read_csv и фильтровать столбцы с помощью usecols

У меня есть файл csv, который не отображается правильно, pandas.read_csvкогда я фильтрую столбцы usecolsи использую несколько индексов. import pandas as pd csv = r"""dummy,date,loc,x bar,20090101,a,1 bar,20090102,a,3 bar,20090103,a,5 bar,20090101,b,1 bar,20090102,b,3 bar,20090103,b,5""" f =...