Вопросы с тегом «numpy»

320
Панды read_csv low_memory и опции dtype

При звонке df = pd.read_csv('somefile.csv') Я получил: /Users/josh/anaconda/envs/py27/lib/python2.7/site-packages/pandas/io/parsers.py:1130: DtypeWarning: столбцы (4,5,7,16) имеют смешанные типы. Укажите опцию dtype при импорте или установите low_memory = False. Почему этот dtypeвариант связан с...

316
Панды создают новый столбец на основе значений из других столбцов / применяют функцию из нескольких столбцов, построчно

Я хочу , чтобы применить свою пользовательскую функцию (она использует если-иначе лестница) в этих шести колонн ( ERI_Hispanic, ERI_AmerInd_AKNatv, ERI_Asian, ERI_Black_Afr.Amer, ERI_HI_PacIsl, ERI_White) в каждой строке моего dataframe. Я пробовал разные методы из других вопросов, но все еще не...

314
Pandas условное создание столбца серии / dataframe

У меня есть датафрейм по линии ниже: Type Set 1 A Z 2 B Z 3 B X 4 C Y Я хочу добавить еще один столбец к фрейму данных (или сгенерировать серию) той же длины, что и фрейм данных (= равное количество записей / строк), который устанавливает зеленый цвет, если Set = 'Z', и 'красный', если Set = иначе...

311
Как мне создать пустой массив / матрицу в NumPy?

Я не могу понять, как использовать массив или матрицу так, как я бы обычно использовал список. Я хочу создать пустой массив (или матрицу), а затем добавить к нему один столбец (или строку) за раз. На данный момент я могу найти единственный способ сделать это: mat = None for col in columns: if mat...

303
Какова цель сетки в Python / NumPy?

Может кто-нибудь объяснить мне, какова цель meshgridфункции в Numpy? Я знаю, что это создает какую-то сетку координат для построения графиков, но я не вижу прямой выгоды от этого. Я изучаю «Машинное обучение Python» у Себастьяна Рашки, и он использует его для построения границ решения. Смотрите...

282
Что делает numpy.random.seed (0)?

Что делает np.random.seedв приведенном ниже коде из учебника Scikit-Learn? Я не очень хорошо разбираюсь в материалах генератора случайных состояний NumPy, так что я бы очень признателен, если принять во внимание то, что говорят обыватели. np.random.seed(0) indices =...

281
Создание Pandas DataFrame из массива Numpy: как указать столбец индекса и заголовки столбцов?

У меня есть массив Numpy, состоящий из списка списков, представляющих двумерный массив с метками строк и именами столбцов, как показано ниже: data = array([['','Col1','Col2'],['Row1',1,2],['Row2',3,4]]) Я хотел бы, чтобы результирующий DataFrame имел Row1 и Row2 в качестве значений индекса, а Col1,...

276
Самый эффективный способ обратить вспять массив

Хотите верьте, хотите нет, но после профилирования моего текущего кода повторяющаяся операция возврата массивов клочков съела гигантский кусок времени выполнения. Сейчас у меня есть общий метод, основанный на представлении: reversed_arr = arr[::-1] Есть ли какой-то другой способ сделать это более...

269
Что означает ось в пандах?

Вот мой код для генерации кадра данных: import pandas as pd import numpy as np dff = pd.DataFrame(np.random.randn(1,2),columns=list('AB')) тогда я получил датафрейм: +------------+---------+--------+ | | A | B | +------------+---------+--------- | 0 | 0.626386| 1.52325|...

266
Объединение двух одномерных массивов NumPy

У меня есть два простых одномерных массива в NumPy . Я должен быть в состоянии объединить их, используя numpy.concatenate . Но я получаю эту ошибку для кода ниже: TypeError: только массивы длины 1 могут быть преобразованы в скаляры Python Код import numpy a = numpy.array([1, 2, 3]) b =...

264
Как взять столбцы-фрагменты данных в пандах

Я загружаю некоторые данные машинного обучения из файла CSV. Первые 2 столбца являются наблюдениями, а остальные столбцы - объектами. В настоящее время я делаю следующее: data = pandas.read_csv('mydata.csv') который дает что-то вроде: data = pandas.DataFrame(np.random.rand(10,5), columns =...

257
Как преобразовать изображение PIL в массив Numpy?

Хорошо, я играю с преобразованием объекта изображения PIL взад-вперед в массив, чтобы я мог сделать более быстрое преобразование пиксель за пикселем, чем PixelAccessпозволил бы объект PIL . Я выяснил, как разместить информацию о пикселях в полезном трехмерном массиве с помощью: pic =...