Как мне преобразовать простой список списков в массив numpy? Строки являются отдельными подсписками, и каждая строка содержит элементы в подсписке.
184
Если ваш список списков содержит списки с различным количеством элементов, то ответ Игнасио Васкеса-Абрамса не будет работать. Вместо этого есть как минимум 3 варианта:
1) Создайте массив из массивов:
x=[[1,2],[1,2,3],[1]]
y=numpy.array([numpy.array(xi) for xi in x])
type(y)
>>><type 'numpy.ndarray'>
type(y[0])
>>><type 'numpy.ndarray'>
2) Создайте массив списков:
x=[[1,2],[1,2,3],[1]]
y=numpy.array(x)
type(y)
>>><type 'numpy.ndarray'>
type(y[0])
>>><type 'list'>
3) Сначала сделайте списки равными по длине:
x=[[1,2],[1,2,3],[1]]
length = max(map(len, x))
y=numpy.array([xi+[None]*(length-len(xi)) for xi in x])
y
>>>array([[1, 2, None],
>>> [1, 2, 3],
>>> [1, None, None]], dtype=object)
dtype=float
тоже работает, конвертируетсяNone
вnp.nan
, что может быть полезно.источник
Так как это самый популярный поиск в Google для преобразования списка в массив Numpy, я предложу следующее, несмотря на то, что ему 4 года:
Когда я впервые подумал сделать это таким образом, я был очень доволен собой, потому что это так просто. Тем не менее, после синхронизации с большим списком списков, это на самом деле быстрее сделать это:
Обратите внимание, что ответ @ 1 Бастьяна не составляет единого непрерывного списка, поэтому я добавил
concatenate
.Во всяком случае ... Я предпочитаю
hstack
подход для элегантного использования Numpy.источник
Это так просто, как:
источник
Опять же, после поиска проблемы преобразования вложенных списков с N уровнями в N-мерный массив я ничего не нашел, поэтому вот мой способ обойти это:
источник
[...[...[...]]]
часть. Вам просто нужно позвонитьnp.array
, сndmin=number-of-list-layers
. (хотя в моем случае мне нужно былоndmin=number-of-list-layers-minus-1
по какой-то причине, иначе создал дополнительный слой - нужно исследовать)np.array
к тому, что они просто «оборачивают» эти самые глубокие списки, а не конвертируют их в массивы.У меня был список списков равной длины. Даже тогда
Ignacio Vazquez-Abrams
ответ не сработал для меня. Я получил двумерный массив NumPy, элементы которого являются списками. Если вы столкнулись с той же проблемой, вы можете использовать метод нижеиспользование
numpy.vstack
источник
Просто используйте панд
это работает только для списка списков
если у вас есть список списков списков, вы можете попробовать что-то вроде
источник