Большая картина выбора матриц в алгоритме Штрассена

В алгоритме Штрассена, чтобы вычислить произведение двух матриц и , матрицы и делятся на блочные матрицы и алгоритм продолжает рекурсивное вычисление блочных матрично-матричных произведений, а не наивных блочных матричных матриц. матричные произведения, т. е. если мы хотим , где $\mathbf{A}$ $\mathbf{B}$ $\mathbf{A}$ $\mathbf{B}$ $2 \times 2$ $7$ $8$ $\mathbf{C}=\mathbf{A} \mathbf{B}$ тогда мы имеем

A знак равно [\begin{matrix} A_{1, 1} & A_{1, 2} \\ A_{2, 1} & A_{2, 2} \end{matrix}], В знак равно [\begin{matrix} В_{1, 1} & В_{1, 2} \\ В_{2, 1} & В_{2, 2} \end{matrix}], С знак равно [\begin{matrix} С_{1, 1} & С_{1, 2} \\ С_{2, 1} & С_{2, 2} \end{matrix}]

$\mathbf{A} =\begin{bmatrix} \mathbf{A}_{1,1} & \mathbf{A}_{1,2} \\ \mathbf{A}_{2,1} & \mathbf{A}_{2,2} \end{bmatrix} \mbox { , } \mathbf{B} = \begin{bmatrix} \mathbf{B}_{1,1} & \mathbf{B}_{1,2} \\ \mathbf{B}_{2,1} & \mathbf{B}_{2,2} \end{bmatrix} \mbox { , } \mathbf{C} = \begin{bmatrix} \mathbf{C}_{1,1} & \mathbf{C}_{1,2} \\ \mathbf{C}_{2,1} & \mathbf{C}_{2,2} \end{bmatrix}$

что требует

умножений. Вместо этого в Штрассене мы вычисляем

С_{1, 1} знак равно A_{1, 1} В_{1, 1} + A_{1, 2} В_{2, 1} С_{1, 2} знак равно A_{1, 1} В_{1, 2} + A_{1, 2} В_{2, 2} С_{2, 1} знак равно A_{2, 1} В_{1, 1} + A_{2, 2} В_{2, 1} С_{2, 2} знак равно A_{2, 1} В_{1, 2} + A_{2, 2} В_{2, 2}

$\mathbf{C}_{1,1} = \mathbf{A}_{1,1} \mathbf{B}_{1,1} + \mathbf{A}_{1,2} \mathbf{B}_{2,1}\\ \mathbf{C}_{1,2} = \mathbf{A}_{1,1} \mathbf{B}_{1,2} + \mathbf{A}_{1,2} \mathbf{B}_{2,2}\\ \mathbf{C}_{2,1} = \mathbf{A}_{2,1} \mathbf{B}_{1,1} + \mathbf{A}_{2,2} \mathbf{B}_{2,1}\\ \mathbf{C}_{2,2} = \mathbf{A}_{2,1} \mathbf{B}_{1,2} + \mathbf{A}_{2,2} \mathbf{B}_{2,2}$

8

$8$

и получить

, используя

качестве

M_{1} знак равно (A_{1, 1} + A_{2, 2}) (В_{1, 1} + В_{2, 2}) M_{2} знак равно (A_{2, 1} + A_{2, 2}) В_{1, 1} M_{3} знак равно A_{1, 1} (В_{1, 2} - В_{2, 2}) M_{4} знак равно A_{2, 2} (В_{2, 1} - В_{1, 1}) M_{5} знак равно (A_{1, 1} + A_{1, 2}) В_{2, 2} M_{6} знак равно (A_{2, 1} - A_{1, 1}) (В_{1, 1} + В_{1, 2}) M_{7} знак равно (A_{1, 2} - A_{2, 2}) (В_{2, 1} + В_{2, 2})

$\mathbf{M}_{1} := (\mathbf{A}_{1,1} + \mathbf{A}_{2,2}) (\mathbf{B}_{1,1} + \mathbf{B}_{2,2})\\ \mathbf{M}_{2} := (\mathbf{A}_{2,1} + \mathbf{A}_{2,2}) \mathbf{B}_{1,1}\\ \mathbf{M}_{3} := \mathbf{A}_{1,1} (\mathbf{B}_{1,2} - \mathbf{B}_{2,2})\\ \mathbf{M}_{4} := \mathbf{A}_{2,2} (\mathbf{B}_{2,1} - \mathbf{B}_{1,1})\\ \mathbf{M}_{5} := (\mathbf{A}_{1,1} + \mathbf{A}_{1,2}) \mathbf{B}_{2,2}\\ \mathbf{M}_{6} := (\mathbf{A}_{2,1} - \mathbf{A}_{1,1}) (\mathbf{B}_{1,1} + \mathbf{B}_{1,2})\\ \mathbf{M}_{7} := (\mathbf{A}_{1,2} - \mathbf{A}_{2,2}) (\mathbf{B}_{2,1} + \mathbf{B}_{2,2})$

C_{i, j}

$\mathbf{C}_{i,j}$

M_{k}

$\mathbf{M}_{k}$

Однако выбор матриц

мне кажется произвольным. Есть ли общая картина, почему мы выбираем эти конкретные произведения подматриц

? Кроме того, я ожидал бы, что

будет задействовать

симметрично, что, похоже, не имеет место. Например, у нас есть

С_{1, 1} знак равно M_{1} + M_{4} - M_{5} + M_{7} С_{1, 2} знак равно M_{3} + M_{5} С_{2, 1} знак равно M_{2} + M_{4} С_{2, 2} знак равно M_{1} - M_{2} + M_{3} + M_{6}

$\mathbf{C}_{1,1} = \mathbf{M}_{1} + \mathbf{M}_{4} - \mathbf{M}_{5} + \mathbf{M}_{7}\\ \mathbf{C}_{1,2} = \mathbf{M}_{3} + \mathbf{M}_{5}\\ \mathbf{C}_{2,1} = \mathbf{M}_{2} + \mathbf{M}_{4}\\ \mathbf{C}_{2,2} = \mathbf{M}_{1} - \mathbf{M}_{2} + \mathbf{M}_{3} + \mathbf{M}_{6}$

M_{k}

$\mathbf{M}_k$

A

$\mathbf{A}$

B

$\mathbf{B}$

M_{k}

$\mathbf{M}_k$

A_{i, j}

$\mathbf{A}_{i,j}$

B_{i, j}

$\mathbf{B}_{i,j}$

. Я ожидаю, что его коллега скажет, что

также будет вычислена. Однако это не так, поскольку его можно получить из других

M_{2} := (A_{2, 1} + A_{2, 2}) B_{1, 1}

$\mathbf{M}_2: = (\mathbf{A}_{2,1}+\mathbf{A}_{2,2})\mathbf{B}_{1,1}$

A_{1, 1} (B_{1, 2} + B_{2, 2})

$\mathbf{A}_{1,1} (\mathbf{B}_{1,2} + \mathbf{B}_{2,2})$

M_{k}

$\mathbf{M}_k$

Буду признателен, если кто-нибудь сможет пролить свет на это.

ds.algorithms linear-algebra matrices matrix-product Сообщество
источник

В книге «Теория алгебраической сложности» Бургиссера, Клаузена и Шокроллахи есть какое-то объяснение (с. 11-12). Идея состоит в том, чтобы начать с двух баз $A_0,A_1,A_2,A_3$ $B_0,B_1,B_2,B_3$ $2\times 2$ $A_iB_j \in \{0,A_0,A_1,A_2,A_3,B_0,B_1,B_2,B_3\}$ $A_0 = B_0$ $A$ $B$ $A_0=B_0,A_1,A_2,A_3,B_1,B_2,B_3$ $M$

Я не знаю, придумал ли Штрассен такой взгляд на это. Рассматривая другие тождества, лежащие в основе быстрых алгоритмов умножения матриц, неясно, происходит ли что-то более глубокое, чем разработка какой-либо формулы. Мы уже проходили это раньше - Лагранж использовал тождество из четырех квадратов (которое было известно ранее), чтобы доказать теорему о четырех квадратах. Сначала это должна была быть просто любопытная алгебраическая идентичность, но теперь мы знаем, что она заявляет о свойстве мультипликативности кватернионной нормы. Учитывая текущее состояние знаний, трудно сказать, является ли приведенная выше интерпретация столь же продуктивной.

Юваль Фильмус
источник

2 \times 2

$2\times 2$

Большая картина выбора матриц в алгоритме Штрассена

Ответы: