Как применить numpy.linalg.norm к каждой строке матрицы?

82

У меня есть 2D-матрица, и я хочу взять норму каждой строки. Но когда использую numpy.linalg.norm(X)напрямую, берется норма всей матрицы.

Я могу взять норму каждой строки, используя цикл for, а затем взять норму каждой X[i], но это занимает огромное время, поскольку у меня 30 тысяч строк.

Есть предложения найти более быстрый способ? Или можно применить np.linalg.normк каждой строке матрицы?

nbro
источник

Ответы:

87

Обратите внимание, что, как показывает перимосокордия , начиная с версии 1.9 NumPy, np.linalg.norm(x, axis=1)это самый быстрый способ вычисления L2-нормы.


Если вы вычисляете L2-норму, вы можете вычислить ее напрямую (используя axis=-1аргумент для суммирования по строкам):

np.sum(np.abs(x)**2,axis=-1)**(1./2)

Конечно, аналогично вычисляются Lp-нормы.

Это значительно быстрее np.apply_along_axis, хотя, возможно, и не так удобно:

In [48]: %timeit np.apply_along_axis(np.linalg.norm, 1, x)
1000 loops, best of 3: 208 us per loop

In [49]: %timeit np.sum(np.abs(x)**2,axis=-1)**(1./2)
100000 loops, best of 3: 18.3 us per loop

Другие ordформы также normмогут быть вычислены напрямую (с аналогичным ускорением):

In [55]: %timeit np.apply_along_axis(lambda row:np.linalg.norm(row,ord=1), 1, x)
1000 loops, best of 3: 203 us per loop

In [54]: %timeit np.sum(abs(x), axis=-1)
100000 loops, best of 3: 10.9 us per loop
Unutbu
источник
8
Почему вы делаете np.abs (x), если вы все равно возводите x в квадрат?
Патрик
10
@Patrick: Если dtype xсложный, это имеет значение. Например, если x = np.array([(1+1j,2+1j)])то np.sum(np.abs(x)**2,axis=-1)**(1./2)есть array([ 2.64575131]), то пока np.sum(x**2,axis=-1)**(1./2)есть array([ 2.20320266+1.36165413j]).
unutbu 03
3
@perimosocordiae опубликовал обновление, которое numpy.linalg.normс его новым axis аргументом в настоящее время является самым быстрым подходом.
Иоаннис Филиппидис
Как сделать то же самое, если я хочу применить норму к матрице по столбцам?
Gunjan naik
@ user3515225: np.linalg.norm(x, axis=0). axisОтносится к оси будучи суммирование. Для 2D-массива ось 0 относится к строкам, поэтому axis=0приводит normк суммированию строк для каждого фиксированного столбца.
unutbu
54

Воскрешение старого вопроса из-за numpy update. Начиная с версии 1.9 numpy.linalg.normтеперь принимает axisаргумент. [ код , документация ]

Это новый самый быстрый способ в городе:

In [10]: x = np.random.random((500,500))

In [11]: %timeit np.apply_along_axis(np.linalg.norm, 1, x)
10 loops, best of 3: 21 ms per loop

In [12]: %timeit np.sum(np.abs(x)**2,axis=-1)**(1./2)
100 loops, best of 3: 2.6 ms per loop

In [13]: %timeit np.linalg.norm(x, axis=1)
1000 loops, best of 3: 1.4 ms per loop

И чтобы доказать, что он рассчитывает то же самое:

In [14]: np.allclose(np.linalg.norm(x, axis=1), np.sum(np.abs(x)**2,axis=-1)**(1./2))
Out[14]: True
перимосокордии
источник
16

Намного быстрее, чем принятый ответ, использует einsum NumPy ,

numpy.sqrt(numpy.einsum('ij,ij->i', a, a))

Обратите внимание на шкалу журнала:

введите описание изображения здесь


Код для воспроизведения сюжета:

import numpy
import perfplot


def sum_sqrt(a):
    return numpy.sqrt(numpy.sum(numpy.abs(a) ** 2, axis=-1))


def apply_norm_along_axis(a):
    return numpy.apply_along_axis(numpy.linalg.norm, 1, a)


def norm_axis(a):
    return numpy.linalg.norm(a, axis=1)


def einsum_sqrt(a):
    return numpy.sqrt(numpy.einsum("ij,ij->i", a, a))


perfplot.show(
    setup=lambda n: numpy.random.rand(n, 3),
    kernels=[sum_sqrt, apply_norm_along_axis, norm_axis, einsum_sqrt],
    n_range=[2 ** k for k in range(20)],
    xlabel="len(a)",
)
Нико Шлёмер
источник
2
Не хотите объяснить, что это / делает?
jhin
6

Попробуйте следующее:

In [16]: numpy.apply_along_axis(numpy.linalg.norm, 1, a)
Out[16]: array([ 5.38516481,  1.41421356,  5.38516481])

где aваш 2D-массив.

Вышеупомянутое вычисляет норму L2. Для другой нормы вы можете использовать что-то вроде:

In [22]: numpy.apply_along_axis(lambda row:numpy.linalg.norm(row,ord=1), 1, a)
Out[22]: array([9, 2, 9])
NPE
источник