Вопросы с тегом «pandas»

245
Показать DataFrame в виде таблицы в iPython Notebook

Я использую ноутбук iPython. Когда я делаю это: df Я получаю красивый стол с клетками. Однако, если я сделаю это: df1 df2 он не печатает первый красивый стол. Если я попробую это: print df1 print df2 Он печатает таблицу в другом формате, который разбрасывает столбцы и делает вывод очень высоким....

245
Получить ряд (ы), которые имеют максимальное количество в группах, используя групповой

Как найти все строки в кадре данных pandas, которые имеют максимальное значение для countстолбца, после группировки по ['Sp','Mt']столбцам? Пример 1: следующий dataFrame, который я группирую по ['Sp','Mt']: Sp Mt Value count 0 MM1 S1 a **3** 1 MM1 S1 n 2 2 MM1 S3 cb 5 3 MM2 S3 mk **8** 4 MM2 S4 bg...

243
Конвертировать Pandas Column в DateTime

У меня есть одно поле в DataFrame панд, который был импортирован в виде строки. Это должна быть переменная datetime. Как преобразовать его в столбец даты и времени, а затем отфильтровать по дате. Пример: Имя фрейма данных : raw_data Название колонки: Mycol Формат значения в столбце: «05SEP2014: 00:...

243
Панды: сбросить уровень из многоуровневого индекса столбца?

Если у меня есть многоуровневый индекс столбца: >>> cols = pd.MultiIndex.from_tuples([("a", "b"), ("a", "c")]) >>> pd.DataFrame([[1,2], [3,4]], columns=cols) --- + - б | с - + --- + - 0 | 1 | 2 1 | 3 | 4 Как я могу опустить уровень «a» этого индекса, чтобы я в итоге: б | с - + ---...

239
Почему не работает моя функция «Применить», относящаяся к нескольким столбцам? [закрыто]

Закрыто. Этот вопрос не воспроизводится или был вызван опечатками . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме переполнения стека. Закрыто в прошлом году . Улучшить этот вопрос У меня есть некоторые проблемы с функцией...

235
Выбор по сложным критериям из панд. DataFrame

Например, у меня есть простой DF: import pandas as pd from random import randint df = pd.DataFrame({'A': [randint(1, 9) for x in xrange(10)], 'B': [randint(1, 9)*10 for x in xrange(10)], 'C': [randint(1, 9)*100 for x in xrange(10)]}) Могу ли я выбрать значения из «A», для которых соответствующие...

234
Как выбрать строки с одним или несколькими нулями в панде DataFrame без явного перечисления столбцов?

У меня есть датафрейм с ~ 300K строк и ~ 40 столбцов. Я хочу выяснить, содержат ли какие-либо строки нулевые значения, и поместить эти «нулевые» строки в отдельный фрейм данных, чтобы их можно было легко изучить. Я могу создать маску явно: mask = False for col in df.columns: mask = mask |...

230
Конвертировать поплавки в панды в броню?

Я работал с данными, импортированными из CSV. Панды изменили некоторые столбцы на плавающие, так что теперь числа в этих столбцах отображаются как плавающие точки! Однако мне нужно, чтобы они отображались в виде целых чисел или без запятой. Есть ли способ преобразовать их в целые числа или не...

230
Панды получают строки, которых нет в другом фрейме данных

У меня есть два фрейма данных панд, у которых есть несколько общих строк. Предположим, dataframe2 является подмножеством dataframe1. Как я могу получить строки dataframe1, которых нет в dataframe2? df1 = pandas.DataFrame(data = {'col1' : [1, 2, 3, 4, 5], 'col2' : [10, 11, 12, 13, 14]}) df2 =...

229
Сохраняйте только часть даты при использовании pandas.to_datetime

Я использую pandas.to_datetimeдля разбора дат в моих данных. Pandas по умолчанию представляет даты, datetime64[ns]хотя все даты только ежедневные. Интересно, есть ли элегантный / умный способ преобразовать даты в datetime.dateили datetime64[D]так, чтобы при записи данных в CSV к датам не...

229
Как я могу получить поэлементное логическое НЕ Серии Панд?

У меня есть Seriesобъект Pandas, содержащий логические значения. Как я могу получить серию, содержащую логическое NOTкаждого значения? Например, рассмотрим серию, содержащую: True True True False Ряд, который я хотел бы получить, содержал бы: False False False True Кажется, это должно быть...

227
Нормализовать столбцы панд данных

У меня есть датафрейм в пандах, где каждый столбец имеет различный диапазон значений. Например: ДФ: A B C 1000 10 0.5 765 5 0.35 800 7 0.09 Любая идея, как я могу нормализовать столбцы этого кадра данных, где каждое значение находится между 0 и 1? Мой желаемый результат: A B C 1 1 1 0.765 0.5 0.7...

221
Как сделать хорошие воспроизводимые примеры панд

Ответы на этот вопрос - работа сообщества . Отредактируйте существующие ответы, чтобы улучшить этот пост. В настоящее время он не принимает новые ответы или взаимодействия. Потратив приличное количество времени на просмотр обоих р и пандтеги на SO, создается впечатление, что pandasвопросы с...

221
Применение нескольких функций к нескольким групповым столбцам

В документах показывают , как применить несколько функций на объекте GroupBy в то время , используя Dict с именами вывода столбцов в качестве ключей: In [563]: grouped['D'].agg({'result1' : np.sum, .....: 'result2' : np.mean}) .....: Out[563]: result2 result1 A bar -0.579846 -1.739537 foo -0.280588...

220
отбрасывать бесконечные значения из информационных кадров в пандах?

Каков самый быстрый / простой способ отбросить значения nan и inf / -inf из DataFrame pandas без сброса mode.use_inf_as_null? Я хотел бы иметь возможность использовать аргументы subsetи , за исключением значений, которые считаются пропущенными, например:howdropnainf df.dropna(subset=["col1",...