Вопросы с тегом «dataframe»

637
Чем отличаются iloc, ix и loc?

Может кто-нибудь объяснить, чем эти три метода нарезки отличаются? Я видел документы , и я видел эти ответы , но я все еще не могу объяснить, чем они отличаются. Мне они кажутся взаимозаменяемыми в значительной степени, потому что они находятся на более низких уровнях нарезки. Например, скажем, мы...

631
Как бороться с SettingWithCopyWarning в Pandas?

Фон Я только что обновил свои панды с 0.11 до 0.13.0rc1. Теперь приложение выдает много новых предупреждений. Один из них, как это: E:\FinReporter\FM_EXT.py:449: SettingWithCopyWarning: A value is trying to be set on a copy of a slice from a DataFrame. Try using .loc[row_index,col_indexer] = value...

543
Уровни коэффициента отбрасывания в заданном кадре данных

У меня есть фрейм данных, содержащий factor. Когда я создаю подмножество этого subsetфрейма данных, используя или другую функцию индексации, создается новый фрейм данных. Однако factorпеременная сохраняет все свои исходные уровни, даже если / если они не существуют в новом кадре данных. Это...

521
Разница между скобками [] и двойными скобками [[]] для доступа к элементам списка или фрейма данных

R предоставляет два разных метода для доступа к элементам списка или data.frame: []и [[]]. В чем разница между этими двумя, в каких ситуациях я должен использовать один над...

513
Преобразовать список во фрейм данных

У меня есть вложенный список данных. Его длина составляет 132, а каждый элемент представляет собой список длиной 20. Существует ли быстрый способ преобразовать эту структуру во фрейм данных, содержащий 132 строки и 20 столбцов данных? Вот некоторые примеры данных для работы: l <- replicate( 132,...

504
Быстрое чтение очень больших таблиц как данных

У меня есть очень большие таблицы (30 миллионов строк), которые я хотел бы загрузить в виде фреймов данных в R. read.table()Имеет много удобных функций, но, похоже, в реализации много логики, которая может замедлить работу. В моем случае, я предполагаю, что знаю типы столбцов заранее, таблица не...

484
Как проверить, является ли какое-либо значение NaN в Pandas DataFrame

В Python Pandas, как лучше всего проверить, имеет ли DataFrame одно (или несколько) значений NaN? Я знаю о функции pd.isnan, но это возвращает DataFrame логических значений для каждого элемента. Этот пост прямо здесь не совсем отвечает и на мой...

480
Создать пустой data.frame

Я пытаюсь инициализировать data.frame без каких-либо строк. По сути, я хочу указать типы данных для каждого столбца и дать им имена, но в результате не нужно создавать никаких строк. Лучшее, что я смог сделать, это что-то вроде: df <- data.frame(Date=as.Date("01/01/2000", format="%m/%d/%Y"),...

479
Установите значение для конкретной ячейки в панде DataFrame, используя индекс

Я создал Pandas DataFrame df = DataFrame(index=['A','B','C'], columns=['x','y']) и получил это ху NaN NaN B NaN NaN C NaN NaN Затем я хочу присвоить значение определенной ячейке, например, для строки «C» и столбца «x». Я ожидал получить такой результат: ху NaN NaN B NaN NaN C 10 NaN с этим кодом:...

468
Разница между картой, applymap и методами применения в Pandas

Можете ли вы сказать мне, когда использовать эти методы векторизации с основными примерами? Я вижу, что mapэто Seriesметод, а остальные DataFrameметоды. Я запутался applyи в applymapметодах, хотя. Почему у нас есть два метода для применения функции к DataFrame? Опять же, простые примеры, которые...

464
Как посчитать значения NaN в столбце в панде DataFrame

У меня есть данные, в которых я хочу найти число NaN, так что, если оно меньше некоторого порога, я опущу эти столбцы. Я посмотрел, но не смог найти никакой функции для этого. есть value_counts, но это будет медленно для меня, потому что большинство значений различны, и я хочу NaNтолько подсчет...

463
Создание пустого DataFrame Pandas, а затем его заполнение?

Я начинаю с документов панд DataFrame здесь: http://pandas.pydata.org/pandas-docs/stable/dsintro.html Я хотел бы итеративно заполнять DataFrame значениями для расчета временных рядов. В общем, я бы хотел инициализировать DataFrame столбцами A, B и строками отметок времени, все 0 или все NaN. Затем...

451
Выделение частичной строкой в ​​панде DataFrame

У меня есть DataFrameс 4 столбцами, из которых 2 содержат строковые значения. Мне было интересно, если есть способ выбрать строки на основе частичного совпадения строк с конкретным столбцом? Другими словами, функция или лямбда-функция, которая будет делать что-то вроде re.search(pattern,...

441
Перемешать строки DataFrame

У меня есть следующий DataFrame: Col1 Col2 Col3 Type 0 1 2 3 1 1 4 5 6 1 ... 20 7 8 9 2 21 10 11 12 2 ... 45 13 14 15 3 46 16 17 18 3 ... DataFrame считывается из файла CSV. Все строки, которые имеют Type1, находятся сверху, за ними следуют строки с Type2, за которыми следуют строки с Type3 и т. Д....

439
Получить статистику для каждой группы (например, количество, среднее и т. Д.), Используя pandas GroupBy?

У меня есть фрейм данных, dfи я использую несколько столбцов из него, чтобы groupby: df['col1','col2','col3','col4'].groupby(['col1','col2']).mean() Таким образом, я почти получаю таблицу (фрейм данных), которая мне нужна. Чего не хватает, так это дополнительного столбца, который содержит...