Этот вопрос продолжает мой вопрос здесь (по совету Mystical): Производительность цикла кода C Продолжая свой вопрос, когда я использую упакованные инструкции вместо скалярных инструкций, код, использующий встроенные функции, будет выглядеть очень похоже: for(int i=0; i<size; i+=16) { y1 =...