У меня проблемы с некоторыми функциями панд. Как проверить, какая у меня версия для
У меня проблемы с некоторыми функциями панд. Как проверить, какая у меня версия для
Я использую ноутбук iPython. Когда я делаю это: df Я получаю красивый стол с клетками. Однако, если я сделаю это: df1 df2 он не печатает первый красивый стол. Если я попробую это: print df1 print df2 Он печатает таблицу в другом формате, который разбрасывает столбцы и делает вывод очень высоким....
Как найти все строки в кадре данных pandas, которые имеют максимальное значение для countстолбца, после группировки по ['Sp','Mt']столбцам? Пример 1: следующий dataFrame, который я группирую по ['Sp','Mt']: Sp Mt Value count 0 MM1 S1 a **3** 1 MM1 S1 n 2 2 MM1 S3 cb 5 3 MM2 S3 mk **8** 4 MM2 S4 bg...
У меня есть одно поле в DataFrame панд, который был импортирован в виде строки. Это должна быть переменная datetime. Как преобразовать его в столбец даты и времени, а затем отфильтровать по дате. Пример: Имя фрейма данных : raw_data Название колонки: Mycol Формат значения в столбце: «05SEP2014: 00:...
Если у меня есть многоуровневый индекс столбца: >>> cols = pd.MultiIndex.from_tuples([("a", "b"), ("a", "c")]) >>> pd.DataFrame([[1,2], [3,4]], columns=cols) --- + - б | с - + --- + - 0 | 1 | 2 1 | 3 | 4 Как я могу опустить уровень «a» этого индекса, чтобы я в итоге: б | с - + ---...
Закрыто. Этот вопрос не воспроизводится или был вызван опечатками . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме переполнения стека. Закрыто в прошлом году . Улучшить этот вопрос У меня есть некоторые проблемы с функцией...
Как я могу читать в файле .csv (без заголовков) и когда мне нужно только подмножество столбцов (скажем, 4-й и 7-й из 20 столбцов), используя панд? Кажется, я не могу...
У меня есть фрейм данных, как это: print(df) 0 1 2 0 354.7 April 4.0 1 55.4 August 8.0 2 176.5 December 12.0 3 95.5 February 2.0 4 85.6 January 1.0 5 152 July 7.0 6 238.7 June 6.0 7 104.8 March 3.0 8 283.5 May 5.0 9 278.8 November 11.0 10 249.6 October 10.0 11 212.7 September 9.0 Как видите, месяцы...
Например, у меня есть простой DF: import pandas as pd from random import randint df = pd.DataFrame({'A': [randint(1, 9) for x in xrange(10)], 'B': [randint(1, 9)*10 for x in xrange(10)], 'C': [randint(1, 9)*100 for x in xrange(10)]}) Могу ли я выбрать значения из «A», для которых соответствующие...
У меня есть датафрейм с ~ 300K строк и ~ 40 столбцов. Я хочу выяснить, содержат ли какие-либо строки нулевые значения, и поместить эти «нулевые» строки в отдельный фрейм данных, чтобы их можно было легко изучить. Я могу создать маску явно: mask = False for col in df.columns: mask = mask |...
Я работал с данными, импортированными из CSV. Панды изменили некоторые столбцы на плавающие, так что теперь числа в этих столбцах отображаются как плавающие точки! Однако мне нужно, чтобы они отображались в виде целых чисел или без запятой. Есть ли способ преобразовать их в целые числа или не...
У меня есть два фрейма данных панд, у которых есть несколько общих строк. Предположим, dataframe2 является подмножеством dataframe1. Как я могу получить строки dataframe1, которых нет в dataframe2? df1 = pandas.DataFrame(data = {'col1' : [1, 2, 3, 4, 5], 'col2' : [10, 11, 12, 13, 14]}) df2 =...
Я использую pandas.to_datetimeдля разбора дат в моих данных. Pandas по умолчанию представляет даты, datetime64[ns]хотя все даты только ежедневные. Интересно, есть ли элегантный / умный способ преобразовать даты в datetime.dateили datetime64[D]так, чтобы при записи данных в CSV к датам не...
У меня есть Seriesобъект Pandas, содержащий логические значения. Как я могу получить серию, содержащую логическое NOTкаждого значения? Например, рассмотрим серию, содержащую: True True True False Ряд, который я хотел бы получить, содержал бы: False False False True Кажется, это должно быть...
У меня есть датафрейм в пандах, где каждый столбец имеет различный диапазон значений. Например: ДФ: A B C 1000 10 0.5 765 5 0.35 800 7 0.09 Любая идея, как я могу нормализовать столбцы этого кадра данных, где каждое значение находится между 0 и 1? Мой желаемый результат: A B C 1 1 1 0.765 0.5 0.7...
У меня есть Dataframe, df, со следующим столбцом: df['ArrivalDate'] = ... 936 2012-12-31 938 2012-12-29 965 2012-12-31 966 2012-12-31 967 2012-12-31 968 2012-12-31 969 2012-12-31 970 2012-12-29 971 2012-12-31 972 2012-12-29 973 2012-12-29 ... Элементами столбца являются pandas.tslib.Timestamp. Я...
Ответы на этот вопрос - работа сообщества . Отредактируйте существующие ответы, чтобы улучшить этот пост. В настоящее время он не принимает новые ответы или взаимодействия. Потратив приличное количество времени на просмотр обоих р и пандтеги на SO, создается впечатление, что pandasвопросы с...
В документах показывают , как применить несколько функций на объекте GroupBy в то время , используя Dict с именами вывода столбцов в качестве ключей: In [563]: grouped['D'].agg({'result1' : np.sum, .....: 'result2' : np.mean}) .....: Out[563]: result2 result1 A bar -0.579846 -1.739537 foo -0.280588...
В R, когда вам нужно получить индекс столбца на основе имени столбца, вы можете сделать idx <- which(names(my_data)==my_colum_name) Есть ли способ сделать то же самое с панелями...
Каков самый быстрый / простой способ отбросить значения nan и inf / -inf из DataFrame pandas без сброса mode.use_inf_as_null? Я хотел бы иметь возможность использовать аргументы subsetи , за исключением значений, которые считаются пропущенными, например:howdropnainf df.dropna(subset=["col1",...