Вопросы с тегом «pandas»

109
Измените одно значение на основе другого значения в пандах

Я пытаюсь перепрограммировать свой код Stata на Python для повышения скорости, и меня указали в сторону PANDAS. Однако мне трудно понять, как обрабатывать данные. Допустим, я хочу перебрать все значения в заголовке столбца «ID». Если этот идентификатор соответствует определенному числу, я хочу...

109
Преобразование ORM SQLAlchemy в pandas DataFrame

Эта тема давно не обсуждалась ни здесь, ни где-либо еще. Есть ли решение, преобразовывающее SQLAlchemy <Query object>в pandas DataFrame? Pandas имеет возможность использовать, pandas.read_sqlно для этого требуется необработанный SQL. У меня есть две причины, по которым я хочу этого избежать:...

109
Панды каждую n-ю строку

Dataframe.resample () работает только с данными таймсерий. Я не могу найти способ получить каждую n-ю строку из данных вне таймсерий. Какой лучший метод?

109
Стратегии тестирования метода pandas read_xml ()

В настоящее время инструменты ввода-вывода pandas не поддерживают read_xml()метод и его аналог to_xml(). Однако read_jsonдоказано , что древовидные структуры могут быть реализованы для импорта фреймов данных и read_htmlдля форматов разметки. Если команда панды действительно считает такой...

108
Что такое dtype ('O') в пандах?

У меня есть фрейм данных в пандах, и я пытаюсь выяснить, каковы типы его значений. Я не уверен, что это за столбец 'Test'. Однако когда я бегу myFrame['Test'].dtype, я получаю; dtype('O') Что это значит?...

108
Как удалить последнюю строку данных фрейма данных pandas

Я думаю, это должно быть просто, но я попробовал несколько идей, и ни одна из них не сработала: last_row = len(DF) DF = DF.drop(DF.index[last_row]) #<-- fail! Я пробовал использовать отрицательные индексы, но это тоже приводило к ошибкам. Я, должно быть, все еще неправильно понимаю что-то...

108
Циклы for в пандах действительно плохи? Когда мне нужно заботиться?

Есть forпетли действительно «плохо»? Если нет, то в каких ситуациях они были бы лучше, чем использование более традиционного «векторизованного» подхода? 1 Я знаком с концепцией «векторизации» и с тем, как pandas использует векторизованные методы для ускорения вычислений. Векторизованные функции...

108
Отбросьте строки со всеми нулями в кадре данных pandas

Я могу использовать pandas dropna()функцию для удаления строк с некоторыми или всеми столбцами, установленными как NA's. Есть ли эквивалентная функция для удаления строк со всеми столбцами, имеющими значение 0? P kt b tt mky depth 1 0 0 0 0 0 2 0 0 0 0 0 3 0 0 0 0 0 4 0 0 0 0 0 5 1.1 3 4.5 2.3 9.0...

107
Python pandas вставить список в ячейку

У меня есть список abc и фрейм данных df: abc = ['foo', 'bar'] df = A B 0 12 NaN 1 23 NaN Я хочу вставить список в ячейку 1B, поэтому мне нужен такой результат: A B 0 12 NaN 1 23 ['foo', 'bar'] Как я могу это сделать? 1) Если я использую это: df.ix[1,'B'] = abc Я получаю следующее сообщение об...

107
Как объединить два фрейма данных?

Я использую фреймы данных Pandas. Скажем, у меня есть исходный фрейм данных D. Я извлекаю из него два фрейма данных следующим образом: A = D[D.label == k] B = D[D.label != k] затем я меняю метку AиB A.label = 1 B.label = -1 Я хочу объединить A и B, чтобы иметь их как один фрейм данных, что-то...

107
Удалите столбцы, имя которых содержит определенную строку из pandas DataFrame

У меня есть фреймворк pandas со следующими именами столбцов: Результат1, Тест1, Результат2, Тест2, Результат3, Тест3 и т. Д. Я хочу удалить все столбцы, в названии которых есть слово «Тест». Количество таких столбцов не является статическим, а зависит от предыдущей функции. Как я могу это сделать?...

107
Выберите строки Pandas на основе индекса списка

У меня есть dataframe df: 20060930 10.103 NaN 10.103 7.981 20061231 15.915 NaN 15.915 12.686 20070331 3.196 NaN 3.196 2.710 20070630 7.907 NaN 7.907 6.459 Затем я хочу выбрать строки с определенными порядковыми номерами, которые указаны в списке, предположим, что здесь [1,3], а затем влево:...

107
Установить порядок столбцов в кадре данных pandas

Есть ли способ изменить порядок столбцов в фрейме данных pandas на основе моих личных предпочтений (то есть не в алфавитном или числовом порядке, а, скорее, в соответствии с определенными соглашениями)? Простой пример: frame = pd.DataFrame({ 'one thing':[1,2,3,4], 'second thing':[0.1,0.2,1,2],...

105
Numpy isnan () не работает с массивом чисел с плавающей запятой (применяется из фрейма данных pandas)

У меня есть массив чисел с плавающей запятой (некоторые нормальные числа, некоторые nans), который выходит из приложения на фреймворке pandas. По какой-то причине numpy.isnan не работает в этом массиве, однако, как показано ниже, каждый элемент является float, numpy.isnan работает правильно для...

105
Есть ли способ автоматически настроить ширину столбцов Excel с помощью pandas.ExcelWriter?

Меня просят создать несколько отчетов в формате Excel. В настоящее время я довольно активно использую pandas для своих данных, поэтому, естественно, я хотел бы использовать метод pandas.ExcelWriter для создания этих отчетов. Однако фиксированная ширина столбца является проблемой. Код, который у...

105
Добавить столбец в фрейм данных pandas

Наверное, это легко, но у меня есть следующие данные: Во фрейме данных 1: index dat1 0 9 1 5 Во фрейме данных 2: index dat2 0 7 1 6 Мне нужен фрейм данных следующей формы: index dat1 dat2 0 9 7 1 5 6 Я пробовал использовать этот appendметод, но получаю перекрестное соединение (т.е. декартово...