Что такое «векторизация»?

190

Несколько раз я встречал этот термин в matlab, fortran ... какой-то другой ... но я так и не нашел объяснения, что это значит, и что он делает? Итак, я спрашиваю здесь, что такое векторизация и что означает, например, что «цикл векторизован»?

Томас Герицма
источник
1
@geoffspear Ссылка, кажется, была перемещена на en.wikipedia.org/wiki/Array_programming
Мне нравится код

Ответы:

225

Многие процессоры имеют наборы команд "vector" или "SIMD", которые применяют одну и ту же операцию одновременно к двум, четырем или более частям данных. Современные чипы x86 имеют инструкции SSE, многие чипы PPC имеют инструкции «Altivec», и даже некоторые чипы ARM имеют набор векторных инструкций, называемый NEON.

«Векторизация» (упрощенная) - это процесс переписывания цикла, чтобы вместо обработки одного элемента массива N раз он обрабатывал (скажем) 4 элемента массива одновременно N / 4 раза.

(Я выбрал 4, потому что это то, что современные аппаратные средства, скорее всего, будут поддерживать напрямую; термин «векторизация» также используется для описания программных преобразований более высокого уровня, когда вы можете просто абстрагировать цикл и описать работу с массивами вместо элементов. которые их составляют)


Разница между векторизацией и развертыванием цикла. Рассмотрим следующий очень простой цикл, который добавляет элементы двух массивов и сохраняет результаты в третьем массиве.

for (int i=0; i<16; ++i)
    C[i] = A[i] + B[i];

Развертывание этого цикла превратило бы его в нечто вроде этого:

for (int i=0; i<16; i+=4) {
    C[i]   = A[i]   + B[i];
    C[i+1] = A[i+1] + B[i+1];
    C[i+2] = A[i+2] + B[i+2];
    C[i+3] = A[i+3] + B[i+3];
}

Векторизация, с другой стороны, производит что-то вроде этого:

for (int i=0; i<16; i+=4)
    addFourThingsAtOnceAndStoreResult(&C[i], &A[i], &B[i]);

Где «addFourThingsAtOnceAndStoreResult» является заполнителем для любых встроенных функций, используемых вашим компилятором для указания векторных инструкций. Обратите внимание, что некоторые компиляторы могут автоматически векторизовать очень простые циклы, подобные этому, которые часто можно включить с помощью опции компиляции. Более сложные алгоритмы все еще требуют помощи программиста для создания хорошего векторного кода.

Стивен Кэнон
источник
11
В чем разница между этим и разматыванием / развертыванием цикла?
Джереми Пауэлл
1
Не правда ли, что компилятору будет проще выполнять автоматическую векторизацию развернутого цикла?
Никос Атанасиу
@NikosAthanasiou: Это правдоподобно, но, вообще говоря, компилятор должен иметь возможность автоматически векторизовать любой цикл, поскольку оба они довольно просты.
Стивен Кэнон
1
@StephenCanon, как можно проверить, были ли некоторые линии векторизованы или нет? Если бы вы использовали objdump, что нужно искать в выводе objdump?
user1823664
3
@Shuklaswag: векторизация - это то, что компиляторы могут сделать для вас, но это также то, что программисты явно делают сами. ОС не задействована.
Стивен Кэнон
32

Векторизация - это термин для преобразования скалярной программы в векторную программу. Векторизованные программы могут выполнять несколько операций из одной инструкции, тогда как скалярные могут работать только с парами операндов одновременно.

Из википедии :

Скалярный подход:

for (i = 0; i < 1024; i++)
{
   C[i] = A[i]*B[i];
}

Векторизованный подход:

for (i = 0; i < 1024; i+=4)
{
   C[i:i+3] = A[i:i+3]*B[i:i+3];
}
Андерс
источник
разве это не то же самое, что скалярный подход? Ваш синтаксис и продвижение цикла отличаются, но ниже вы все еще умножаете его в 4 раза. Но как-то это будет быстрее, вероятно, у процессора есть инструкции, которые делают трюк под названием векторизация.
MSCW
Похоже, я отвечу на свой вопрос здесь. Синтаксис в подходе векторизации, когда компилятор увидит это, преобразует его в оптимизированные инструкции ЦП, которые умножают векторы. Как SIMD.
Mskw
10

Это относится к возможности выполнять одну математическую операцию над списком - или «вектором» - чисел за один шаг. Вы часто видите это с Фортраном, потому что это связано с научными вычислениями, которые связаны с суперкомпьютингом, где впервые появилась векторная арифметика. В настоящее время почти все настольные процессоры предлагают некоторую форму векторизованной арифметики посредством таких технологий, как Intel SSE. Графические процессоры также предлагают форму векторизованной арифметики.

Уоррен Янг
источник
7

Векторизация широко используется в научных вычислениях, где необходимо эффективно обрабатывать огромные порции данных.

В реальном программном приложении я знаю, что оно используется в NUMPY (не уверен в другом).

Numpy (пакет для научных вычислений на python) использует векторизацию для быстрого манипулирования n-мерным массивом, что обычно медленнее, если это делается с помощью встроенных опций python для обработки массивов.

хотя существует множество объяснений, ЧТО ЗДЕСЬ ВЕКТОРИЗАЦИЯ ОПРЕДЕЛЕНА, КАК НА СТРАНИЦЕ NUMPY DOCUMENTATION

Векторизация описывает отсутствие какого-либо явного зацикливания, индексации и т. Д. В коде - эти вещи происходят, конечно, просто «за кулисами» в оптимизированном, предварительно скомпилированном коде Си. Векторизованный код имеет много преимуществ, среди которых:

  1. векторизованный код более лаконичен и удобен для чтения

  2. меньше строк кода обычно означает меньше ошибок

  3. код более похож на стандартную математическую нотацию (облегчая, как правило, правильное кодирование математических конструкций)

  4. Векторизация приводит к большему количеству «Pythonic» кода. Без векторизации наш код был бы завален неэффективными и трудными для чтения циклами.

плохой программист
источник
4

Простыми словами, векторизация означает оптимизацию алгоритма, чтобы он мог использовать SIMD-инструкции в процессорах.

AVX, AVX2 и AVX512 - это наборы команд (intel), которые выполняют одну и ту же операцию над несколькими данными в одной инструкции. например, AVX512 означает, что вы можете работать с 16 целочисленными значениями (4 байта) одновременно. Это означает, что если у вас есть вектор из 16 целых чисел, и вы хотите удвоить это значение в каждом целом числе, а затем добавить к нему 10. Вы можете либо загрузить значения в общий регистр [a, b, c] 16 раз и выполнить ту же операцию, либо выполнить ту же операцию, загрузив все 16 значений в SIMD-регистры [xmm, ymm] и выполнить операцию один раз. Это позволяет ускорить вычисление векторных данных.

В векторизации мы используем это в наших интересах, перемоделируя наши данные, чтобы мы могли выполнять SIMD-операции с ними и ускорять программу.

Единственная проблема с векторизацией - это условия обработки. Потому что условия ветвят поток исполнения. Это может быть сделано путем маскировки. Путем моделирования условия в арифметическую операцию. например. если мы хотим добавить 10 к значению, если оно больше 100. мы можем либо.

if(x[i] > 100) x[i] += 10; // this will branch execution flow.

или мы можем смоделировать условие в арифметической операции, создав вектор условия c,

c[i] = x[i] > 100; // storing the condition on masking vector
x[i] = x[i] + (c[i] & 10) // using mask

хотя это очень тривиальный пример ... таким образом, c - это наш маскирующий вектор, который мы используем для выполнения двоичной операции на основе ее значения. Это позволяет избежать ветвления потока выполнения и обеспечивает векторизацию.

Векторизация так же важна, как распараллеливание. Таким образом, мы должны максимально использовать это. Все современные процессоры имеют SIMD-инструкции для тяжелых вычислительных нагрузок. Мы можем оптимизировать наш код для использования этих инструкций SIMD, используя векторизацию, это похоже на распараллеливание нашего кода для работы на нескольких ядрах, доступных на современных процессорах.

Я хотел бы остановиться на упоминании OpenMP, который позволяет векторизовать код с помощью прагм. Я считаю это хорошей отправной точкой. То же самое можно сказать и об OpenACC.

Рыночная очередь
источник
0

По мнению людей Intel, это легко понять.

Векторизация - это процесс преобразования алгоритма из работы с одним значением за раз в работу с набором значений за один раз . Современные процессоры обеспечивают прямую поддержку векторных операций, когда одна инструкция применяется к нескольким данным (SIMD).

Например, процессор с 512-битным регистром может содержать 16 32-битных двойных одинарной точности и выполнять один расчет.

В 16 раз быстрее, чем выполнение одной инструкции за раз. Объединение этого с многопоточными и многоядерными процессорами приводит к увеличению производительности на несколько порядков.

Ссылка https://software.intel.com/en-us/articles/vectorization-a-key-tool-to-improve-performance-on-modern-cpus

В Java есть возможность включить это в JDK 15 от 2020 года или позднее в JDK 16 в 2021 году.

https://bugs.openjdk.java.net/browse/JDK-8201271

chiperortiz
источник
-4

Смотрите два ответа выше. Я просто хотел добавить, что причина желания делать векторизацию состоит в том, что эти операции могут легко выполняться в паралеле суперкомпьютерами и многопроцессорными процессами, что дает большой выигрыш в производительности. На однопроцессорных компьютерах прирост производительности не будет.

Ларри Ватанабэ
источник
12
«На однопроцессорных компьютерах прирост производительности не будет»: неправда. Большинство современных процессоров имеют (ограниченную) аппаратную поддержку векторизации (SSE, Altivec и т. Д., Как названо stephentyrone), что может дать значительное ускорение при использовании.
слеске
спасибо, я забыл, что распараллеливание можно проводить и на этом уровне.
Ларри Ватанабе