Как выбрать строки на DataFrameоснове значений в некотором столбце в Python Pandas? В SQL я бы использовал: SELECT * FROM table WHERE colume_name = some_value Я попытался просмотреть документацию панд, но не сразу нашел...
Фрейм данных является табличной структурой данных. Обычно он содержит данные, где строки - это наблюдения, а столбцы - переменные различных типов. В то время как «фрейм данных» или «фрейм данных» - это термин, используемый для этой концепции в нескольких языках (R, Apache Spark, deedle, Maple, библиотека pandas в Python и библиотека DataFrames в Julia), «таблица» - это термин, используемый в MATLAB и SQL.
Как выбрать строки на DataFrameоснове значений в некотором столбце в Python Pandas? В SQL я бы использовал: SELECT * FROM table WHERE colume_name = some_value Я попытался просмотреть документацию панд, но не сразу нашел...
У меня есть DataFrameот панды: import pandas as pd inp = [{'c1':10, 'c2':100}, {'c1':11,'c2':110}, {'c1':12,'c2':120}] df = pd.DataFrame(inp) print df Вывод: c1 c2 0 10 100 1 11 110 2 12 120 Теперь я хочу перебрать строки этого кадра. Для каждой строки я хочу иметь возможность доступа к ее...
У меня есть DataFrame, использующий панды и метки столбцов, которые мне нужно отредактировать, чтобы заменить оригинальные метки столбцов. Я хотел бы изменить имена столбцов в DataFrame, Aгде исходные имена столбцов: ['$a', '$b', '$c', '$d', '$e'] в ['a', 'b', 'c', 'd', 'e']. У меня есть...
При удалении столбца в DataFrame я использую: del df['column_name'] И это прекрасно работает. Почему я не могу использовать следующее? del df.column_name Поскольку можно получить доступ к столбцу / серии как df.column_name, я ожидал, что это...
Я хочу отсортировать data.frame по нескольким столбцам. Например, с помощью data.frame ниже я бы хотел отсортировать по столбцу z(по убыванию), а затем по столбцу b(по возрастанию): dd <- data.frame(b = factor(c("Hi", "Med", "Hi", "Low"), levels = c("Low", "Med", "Hi"), ordered = TRUE), x =...
Даны два фрейма данных: df1 = data.frame(CustomerId = c(1:6), Product = c(rep("Toaster", 3), rep("Radio", 3))) df2 = data.frame(CustomerId = c(2, 4, 6), State = c(rep("Alabama", 2), rep("Ohio", 1))) df1 # CustomerId Product # 1 Toaster # 2 Toaster # 3 Toaster # 4 Radio # 5 Radio # 6 Radio df2 #...
У меня есть данные в разных столбцах, но я не знаю, как извлечь их, чтобы сохранить в другой переменной. index a b c 1 2 3 4 2 3 4 5 Как выбрать 'a', 'b'и сохранить его , чтобы df1? Я старался df1 = df['a':'b'] df1 = df.ix[:, 'a':'b'] Никто, кажется, не...
Я хочу получить список заголовков столбцов в панде DataFrame. DataFrame будет поступать от пользователя, поэтому я не буду знать, сколько будет столбцов или как они будут называться. Например, если мне дан DataFrame, как это: >>> my_dataframe y gdp cap 0 1 2 5 1 2 3 9 2 8 7 2 3 3 4 7 4 6 7...
У меня есть следующий индексированный DataFrame с именованными столбцами и строками, не являющимися непрерывными числами: a b c d 2 0.671399 0.101208 -0.181532 0.241273 3 0.446172 -0.243316 0.051767 1.577318 5 0.614758 0.075793 -0.451460 -0.012493 Я хотел бы добавить новый столбец 'e'в существующий...
Я пытаюсь получить количество строк в df с помощью Pandas, и вот мой код. Способ 1: total_rows = df.count print total_rows +1 Способ 2: total_rows = df['First_columnn_label'].count print total_rows +1 Оба фрагмента кода дают мне эту ошибку: Ошибка типа: неподдерживаемые типы операндов для +:...
У меня есть следующее DataFrame( df): import numpy as np import pandas as pd df = pd.DataFrame(np.random.rand(10, 5)) Я добавляю больше столбцов по заданию: df['mean'] = df.mean(1) Как я могу переместить столбец meanвперед, то есть установить его в качестве первого столбца, оставив порядок...
У меня есть несколько столбцов, которые я хотел бы удалить из фрейма данных. Я знаю, что мы можем удалить их по отдельности, используя что-то вроде: df$x <- NULL Но я надеялся сделать это с меньшим количеством команд. Кроме того, я знаю, что я мог бы отбросить столбцы, используя целочисленную...
Я понимаю, что pandas предназначен для загрузки полностью заполненных, DataFrameно мне нужно создать пустой DataFrame, а затем добавить строки, одну за другой . Каков наилучший способ сделать это? Я успешно создал пустой DataFrame с: res = DataFrame(columns=('lib', 'qty1', 'qty2')) Затем я могу...
Я хотел бы удалить строки в этом фрейме данных, которые: а) содержать NAs во всех столбцах. Ниже мой пример фрейма данных. gene hsap mmul mmus rnor cfam 1 ENSG00000208234 0 NA NA NA NA 2 ENSG00000199674 0 2 2 2 2 3 ENSG00000221622 0 NA NA NA NA 4 ENSG00000207604 0 NA NA 1 2 5 ENSG00000207431 0 NA...
Я хочу преобразовать таблицу, представленную в виде списка списков, в Pandas DataFrame. В качестве чрезвычайно упрощенного примера: a = [['a', '1.2', '4.2'], ['b', '70', '0.03'], ['x', '5', '0']] df = pd.DataFrame(a) Каков наилучший способ преобразования столбцов в соответствующие типы, в данном...
Я имею это DataFrameи хочу только записи, EPSстолбец которых не NaN: >>> df STK_ID EPS cash STK_ID RPT_Date 601166 20111231 601166 NaN NaN 600036 20111231 600036 NaN 12 600016 20111231 600016 4.3 NaN 601009 20111231 601009 NaN NaN 601939 20111231 601939 2.5 NaN 000001 20111231 000001 NaN...
У меня есть фрейм данных и некоторые столбцы имеют NAзначения. Как заменить эти NAзначения
У меня есть данные в пандах, которые я хотел бы записать в файл CSV. Я делаю это с помощью: df.to_csv('out.csv') И получаю ошибку: UnicodeEncodeError: 'ascii' codec can't encode character u'\u03b1' in position 20: ordinal not in range(128) Есть ли способ обойти это легко (то есть у меня есть...
У меня есть список словарей, как это: [{'points': 50, 'time': '5:00', 'year': 2010}, {'points': 25, 'time': '6:00', 'month': "february"}, {'points':90, 'time': '9:00', 'month': 'january'}, {'points_h1':20, 'month': 'june'}] И я хочу превратить это в панд, DataFrameкак это: month points points_h1...
Я много работаю с Series и DataFrames на терминале. По умолчанию __repr__для серии возвращается уменьшенная выборка с некоторыми значениями головы и хвоста, но остальные отсутствуют. Есть ли встроенный способ красивой печати всей серии / DataFrame? В идеале, он будет поддерживать правильное...