Как вы извлекаете столбец из многомерного массива?

Ответы:

227
>>> import numpy as np
>>> A = np.array([[1,2,3,4],[5,6,7,8]])

>>> A
array([[1, 2, 3, 4],
    [5, 6, 7, 8]])

>>> A[:,2] # returns the third columm
array([3, 7])

Смотрите также: «numpy.arange» и «reshape» для выделения памяти

Пример: (Выделение массива с формированием матрицы (3x4))

nrows = 3
ncols = 4
my_array = numpy.arange(nrows*ncols, dtype='double')
my_array = my_array.reshape(nrows, ncols)
Андре Луис
источник
8
Мне потребовалось 2 часа, чтобы обнаружить [:, 2], угадайте, что эта функция отсутствует в официальной литературе по нарезке?
Никен
Что значит запятая?
Фил,
3
@Phil [row, col]. запятая отделяется.
AsheKetchum
11
Как этот ответ может иметь так много голосов? ОП ни разу не сказал, что это
пустышка
3
для извлечения 2 столбцов: A [:, [1,3]] например извлечение второго и четвертого столбцов
sadalsuud
177

Может быть, вы используете массив NumPy ? В Python есть модуль массива , но он не поддерживает многомерные массивы. Обычные списки Python тоже одномерные.

Однако, если у вас есть простой двумерный список, подобный этому:

A = [[1,2,3,4],
     [5,6,7,8]]

тогда вы можете извлечь столбец следующим образом:

def column(matrix, i):
    return [row[i] for row in matrix]

Извлечение второго столбца (индекс 1):

>>> column(A, 1)
[2, 6]

Или просто:

>>> [row[1] for row in A]
[2, 6]
Мартин Гайслер
источник
80

Если у вас есть массив как

a = [[1, 2], [2, 3], [3, 4]]

Затем вы извлекаете первый столбец так:

[row[0] for row in a]

Итак, результат выглядит так:

[1, 2, 3]
Андрей Арсенин
источник
38

проверить это!

a = [[1, 2], [2, 3], [3, 4]]
a2 = zip(*a)
a2[0]

это то же самое, что и выше, за исключением того, что как-то лучше, когда zip выполняет работу, но требует в качестве аргументов одиночные массивы, синтаксис * a распаковывает многомерный массив в аргументы одного массива

Mac D
источник
7
Что выше? Помните, что ответы не всегда сортируются одинаково.
Мухд
2
Это чисто, но не может быть наиболее эффективным, если производительность представляет собой проблему, поскольку она транспонирует всю матрицу.
IceArdor
6
К вашему сведению, это работает в Python 2, но в Python 3 вы получите объект генератора, который, конечно, не является подписным.
Ришабх Аграри
@RishabhAgrahari В любом случае, чтобы сделать этот почтовый индекс в Py3?
CtrlAltF2
2
@WarpDriveEnterprises Да, вам придется преобразовать объект генератора в список, а затем выполнить подписку. Пример:a2 = zip(*a); a2 = list(a2); a2[0]
Rishabh Agrahari
14
def get_col(arr, col):
    return map(lambda x : x[col], arr)

a = [[1,2,3,4], [5,6,7,8], [9,10,11,12],[13,14,15,16]]

print get_col(a, 3)

Функция map в Python - это еще один способ.

Питер Пол
источник
11
>>> x = arange(20).reshape(4,5)
>>> x array([[ 0,  1,  2,  3,  4],
        [ 5,  6,  7,  8,  9],
        [10, 11, 12, 13, 14],
        [15, 16, 17, 18, 19]])

если вы хотите второй столбец вы можете использовать

>>> x[:, 1]
array([ 1,  6, 11, 16])
simomod
источник
1
Это использует NumPy?
Навсегда
1
Я не могу найти документацию для arange()Python3 за пределами NumPy. Кто угодно?
Кевин W Мэтьюз
9

Оператор itemgetter также может помочь, если вам нравится Python с уменьшением карты, а не списки, для небольшого разнообразия!

# tested in 2.4
from operator import itemgetter
def column(matrix,i):
    f = itemgetter(i)
    return map(f,matrix)

M = [range(x,x+5) for x in range(10)]
assert column(M,1) == range(1,11)
Грегг Линд
источник
1
используйте itertools.imap для больших данных
Павел Полевич,
Подход с использованием itemgetter работал примерно в 50 раз быстрее, чем подход с использованием списков для моего варианта использования. Python 2.7.2, вариант использования был много итераций на матрице с несколькими сотнями строк и столбцов.
Joelpt
7

Вы также можете использовать это:

values = np.array([[1,2,3],[4,5,6]])
values[...,0] # first column
#[1,4]

Примечание: это не работает для встроенного массива и не выровнено (например, np.array ([[1,2,3], [4,5,6,7]]))

Сергей
источник
6

Я думаю, что вы хотите извлечь столбец из массива, такого как массив ниже

import numpy as np
A = np.array([[1,2,3,4],[5,6,7,8],[9,10,11,12]])

Теперь, если вы хотите получить третий столбец в формате

D=array[[3],
[7],
[11]]

Затем вам нужно сначала сделать массив матрицей

B=np.asmatrix(A)
C=B[:,2]
D=asarray(C)

И теперь вы можете делать поэлементные вычисления так же, как в Excel.

danielinthelionsden
источник
1
Хотя это мне очень помогло, я думаю, что ответ может быть намного короче: 1. A = np.array ([[1,2,3,4], [5,6,7,8], [9,10, 11,12]]) 2. Массив [:, 1] >> ([2, 6, 10])
Ufos
6

скажем, у нас есть n X mматрица ( nстроки и mстолбцы) скажем, 5 строк и 4 столбца

matrix = [[1,2,3,4],[5,6,7,8],[9,10,11,12],[13,14,15,16],[17,18,19,20]]

Чтобы извлечь столбцы в Python, мы можем использовать понимание списка, как это

[ [row[i] for row in matrix] for in range(4) ]

Вы можете заменить 4 на любое количество столбцов в вашей матрице. Результат

[ [1,5,9,13,17],[2,10,14,18],[3,7,11,15,19],[4,8,12,16,20] ]

Serge_k
источник
Создает ли это совершенно новый список?
Кевин W Мэтьюз
5
array = [[1,2,3,4],[5,6,7,8],[9,10,11,12],[13,14,15,16]]

col1 = [val[1] for val in array]
col2 = [val[2] for val in array]
col3 = [val[3] for val in array]
col4 = [val[4] for val in array]
print(col1)
print(col2)
print(col3)
print(col4)

Output:
[1, 5, 9, 13]
[2, 6, 10, 14]
[3, 7, 11, 15]
[4, 8, 12, 16]
подветренный
источник
4

Еще один способ использования матриц

>>> from numpy import matrix
>>> a = [ [1,2,3],[4,5,6],[7,8,9] ]
>>> matrix(a).transpose()[1].getA()[0]
array([2, 5, 8])
>>> matrix(a).transpose()[0].getA()[0]
array([1, 4, 7])
Shashwat
источник
3

Если у вас есть двумерный массив в Python (не numpy), вы можете извлечь все столбцы следующим образом:

data = [
['a', 1, 2], 
['b', 3, 4], 
['c', 5, 6]
]

columns = list(zip(*data))

print("column[0] = {}".format(columns[0]))
print("column[1] = {}".format(columns[1]))
print("column[2] = {}".format(columns[2]))

Выполнение этого кода даст,

>>> print("column[0] = {}".format(columns[0]))
column[0] = ('a', 'b', 'c')

>>> print("column[1] = {}".format(columns[1]))
column[1] = (1, 3, 5)

>>> print("column[2] = {}".format(columns[2]))
column[2] = (2, 4, 6)

Конечно, вы можете извлечь один столбец по индексу (например columns[0])

Рассел
источник
2

Несмотря на использование zip(*iterable)для транспонирования вложенного списка, вы также можете использовать следующее, если вложенные списки имеют разную длину:

map(None, *[(1,2,3,), (4,5,), (6,)])

результаты в:

[(1, 4, 6), (2, 5, None), (3, None, None)]

Первый столбец, таким образом:

map(None, *[(1,2,3,), (4,5,), (6,)])[0]
#>(1, 4, 6)
Лоренц Ло Зауэр
источник
2

Ну, немного "поздно" ...

В случае, если производительность имеет значение, а ваши данные имеют прямоугольную форму, вы также можете хранить их в одном измерении и получать доступ к столбцам с помощью регулярного среза, например ...

A = [[1,2,3,4],[5,6,7,8]]     #< assume this 4x2-matrix
B = reduce( operator.add, A ) #< get it one-dimensional

def column1d( matrix, dimX, colIdx ):
  return matrix[colIdx::dimX]

def row1d( matrix, dimX, rowIdx ):
  return matrix[rowIdx:rowIdx+dimX] 

>>> column1d( B, 4, 1 )
[2, 6]
>>> row1d( B, 4, 1 )
[2, 3, 4, 5]

Приятно то, что это действительно быстро. Однако отрицательные показатели здесь не работают! Таким образом, вы не можете получить доступ к последнему столбцу или строке по индексу -1.

Если вам нужна отрицательная индексация, вы можете немного настроить функции доступа, например,

def column1d( matrix, dimX, colIdx ):
  return matrix[colIdx % dimX::dimX]

def row1d( matrix, dimX, dimY, rowIdx ):
  rowIdx = (rowIdx % dimY) * dimX
  return matrix[rowIdx:rowIdx+dimX]
Zappotek
источник
Я проверил этот метод, и стоимость извлечения столбца намного дешевле, чем для вложенных циклов. Однако уменьшение 2d матрицы до 1d стоит дорого, если матрица большая, скажем, 1000 * 1000.
Чжунцзюнь «Марк» Цзинь
2

Если вы хотите получить более одного столбца, просто используйте слайс:

 a = np.array([[1, 2, 3],[4, 5, 6],[7, 8, 9]])
    print(a[:, [1, 2]])
[[2 3]
[5 6]
[8 9]]
Molina12
источник
2

Я предпочитаю следующую подсказку: назвав матрицу matrix_aи используя column_number, например:

import numpy as np
matrix_a = np.array([[1,2,3,4],[5,6,7,8],[9,10,11,12]])
column_number=2

# you can get the row from transposed matrix - it will be a column:
col=matrix_a.transpose()[column_number]
Вик Ермоленко
источник
1

Просто используйте transpose (), тогда вы можете получить столбцы так же просто, как строки

matrix=np.array(originalMatrix).transpose()
print matrix[NumberOfColum]
Дэвид Татис
источник
0

Все столбцы из матрицы в новый список:

N = len(matrix) 
column_list = [ [matrix[row][column] for row in range(N)] for column in range(N) ]
user136036
источник