Вопросы с тегом «pandas»

121

Найдите максимальное значение столбца и верните соответствующие значения строки с помощью Pandas

Используя Python Pandas, я пытаюсь найти Country& Placeс максимальным значением. Это возвращает максимальное значение: data.groupby(['Country','Place'])['Value'].max() Но как мне получить соответствующее Countryи...

121

Как записать в существующий файл Excel без перезаписи данных (с помощью pandas)?

Я использую pandas для записи в файл excel следующим образом: import pandas writer = pandas.ExcelWriter('Masterfile.xlsx') data_filtered.to_excel(writer, "Main", cols=['Diff1', 'Diff2']) writer.save() Masterfile.xlsx уже состоит из нескольких разных вкладок. Однако в нем еще нет «Main». Pandas...

python excel python-2.7 pandas

120

Как разложить (взорвать) столбец в фрейме данных pandas?

У меня есть следующий DataFrame, в котором один из столбцов является объектом (ячейка типа списка): df=pd.DataFrame({'A':[1,2],'B':[[1,2],[1,2]]}) df Out[458]: A B 0 1 [1, 2] 1 2 [1, 2] Мой ожидаемый результат: A B 0 1 1 1 1 2 3 2 1 4 2 2 Что мне делать для этого? Связанный вопрос pandas: когда...

python pandas dataframe

120

панды конвертируют некоторые столбцы в строки

Итак, в моем наборе данных есть информация по местоположению для n дат. Проблема в том, что каждая дата на самом деле является отдельным заголовком столбца. Например, CSV выглядит как location name Jan-2010 Feb-2010 March-2010 A "test" 12 20 30 B "foo" 18 20 25 Я бы хотел, чтобы это выглядело как...

python pandas

119

Как проверить, содержит ли строка одну из подстрок в списке в пандах?

Есть ли какая-нибудь функция, которая была бы эквивалентом комбинации df.isin()и df[col].str.contains()? Например, скажем, у меня есть серия s = pd.Series(['cat','hat','dog','fog','pet']), и я хочу найти все места, где sесть что-то из ['og', 'at'], я бы хотел получить все, кроме «pet». У меня есть...

python string pandas dataframe match

119

Вектор-столбец y был передан, когда ожидался 1d-массив

Мне нужно соответствовать RandomForestRegressorот sklearn.ensemble. forest = ensemble.RandomForestRegressor(**RF_tuned_parameters) model = forest.fit(train_fold, train_y) yhat = model.predict(test_fold) Этот код всегда работал, пока я не произвел предварительную обработку данных ( train_y). В...

python pandas numpy scikit-learn

119

Какие правила использует Pandas для создания представления или копии?

Я смущен правилами, которые использует Pandas, когда решает, что выбор из фрейма данных является копией исходного фрейма данных или представлением оригинала. Если у меня, например, df = pd.DataFrame(np.random.randn(8,8), columns=list('ABCDEFGH'), index=range(1,9)) Я понимаю, что a queryвозвращает...

python pandas dataframe indexing chained-assignment

119

добавить префикс строки к каждому значению в столбце строки с помощью Pandas

Я хотел бы добавить строку в начало каждого значения в указанном столбце фрейма данных pandas (элегантно). Я уже понял, как это сделать, и сейчас использую: df.ix[(df['col'] != False), 'col'] = 'str'+df[(df['col'] != False), 'col'] Это кажется чертовски неэлегантным делом - знаете ли вы какой-либо...

python string pandas dataframe

118

Как преобразовать результат SQL-запроса в структуру данных PANDAS?

Мы будем благодарны за любую помощь по этой проблеме. Итак, в основном я хочу запустить запрос к моей базе данных SQL и сохранить возвращенные данные в виде структуры данных Pandas. Я прикрепил код для запроса. Я читаю документацию по Pandas, но не могу определить тип возвращаемого значения моего...

python mysql data-structures pandas

118

Как подавить предупреждение Pandas Future?

Когда я запускаю программу, Pandas каждый раз выдает предупреждение о будущем, как показано ниже. D:\Python\lib\site-packages\pandas\core\frame.py:3581: FutureWarning: rename with inplace=True will return None from pandas 0.11 onward " from pandas 0.11 onward", FutureWarning) Я получил сообщение,...

python pandas suppress-warnings future-warning

118

Игнорирование NaN с помощью str.contains

Я хочу найти строки, содержащие строку, например: DF[DF.col.str.contains("foo")] Однако это не удается, потому что некоторые элементы имеют NaN: ValueError: невозможно проиндексировать вектор, содержащий значения NA / NaN Поэтому я прибегаю к запутанному...

python pandas

117

Правильный способ отменить pandas.DataFrame?

Вот мой код: import pandas as pd data = pd.DataFrame({'Odd':[1,3,5,6,7,9], 'Even':[0,2,4,6,8,10]}) for i in reversed(data): print(data['Odd'], data['Even']) Когда я запускаю этот код, я получаю следующую ошибку: Traceback (most recent call last): File...

python pandas reverse

116

Распечатать очень длинную строку полностью в кадре данных pandas

Я борюсь с, казалось бы, очень простой вещью: у меня есть фрейм данных pandas, содержащий очень длинную строку. df = pd.DataFrame({'one' : ['one', 'two', 'This is very long string very long string very long string veryvery long string']}) Теперь, когда я пытаюсь напечатать то же самое, я не вижу...

python string pandas options

116

Pandas DataFrame в список списков

Список списков легко превратить в фреймворк pandas: import pandas as pd df = pd.DataFrame([[1,2,3],[3,4,5]]) Но как мне снова превратить df в список списков? lol = df.what_to_do_now? print lol #

python pandas

115

Когда я должен когда-либо использовать pandas apply () в своем коде?

Я видел много ответов на вопросы о переполнении стека, связанные с использованием метода Pandas apply. Я также видел, как пользователи комментируют под ними, говоря, что « applyработает медленно, и этого следует избегать». Я прочитал много статей на тему производительности, которые объясняют...

python pandas performance apply

115

Довольно печать фрейма данных pandas

Как я могу распечатать фрейм данных pandas в виде красивой текстовой таблицы, как показано ниже? +------------+---------+-------------+ | column_one | col_two | column_3 | +------------+---------+-------------+ | 0 | 0.0001 | ABCD | | 1 | 1e-005 | ABCD | | 2 | 1e-006 | long string | | 3 | 1e-007 |...

python pandas dataframe printing

115

Создание фрейма данных из словаря, где записи имеют разную длину

Скажем, у меня есть словарь с 10 парами ключ-значение. Каждая запись содержит массив numpy. Однако длина массива не у всех одинакова. Как я могу создать фрейм данных, в котором каждый столбец содержит отдельную запись? Когда я пытаюсь: pd.DataFrame(my_dict) Я получил: ValueError: arrays must all be...

python pandas

114

Форматировать ось Y в процентах

У меня есть существующий сюжет, созданный с помощью таких пандов: df['myvar'].plot(kind='bar') Ось y имеет формат с плавающей запятой, и я хочу изменить ось y на проценты. Во всех найденных мною решениях используется синтаксис ax.xyz, и я могу разместить код только под строкой выше, которая создает...

python pandas matplotlib plot

114

Могут ли панды использовать столбец в качестве индекса?

У меня есть такая таблица: Locality 2005 2006 2007 2008 2009 ABBOTSFORD 427000 448000 602500 600000 638500 ABERFELDIE 534000 600000 735000 710000 775000 AIREYS INLET459000 440000 430000 517500 512500 Я не хочу вручную менять местами столбец со строкой. Можно ли использовать панды для чтения данных...

python excel pandas

113

Преобразование строк в числа с плавающей запятой в DataFrame

Как преобразовать столбец DataFrame, содержащий строки и NaNзначения, в числа с плавающей запятой. И есть еще один столбец, значениями которого являются строки и числа с плавающей запятой; как преобразовать весь этот столбец в числа с плавающей...

python pandas