Вопросы с тегом «blas»

74
Насколько лучше на самом деле компиляторы Фортрана?

Этот вопрос является продолжением двух обсуждений, недавно появившихся в ответах на " C ++ против Fortran for HPC ". И это больше вызов, чем вопрос ... Один из наиболее часто звучащих аргументов в пользу Fortran заключается в том, что компиляторы просто лучше. Поскольку большинство компиляторов C /...

26
Какова взаимосвязь BLAS, LAPACK и других библиотек линейной алгебры?

Я искал библиотеки линейной алгебры C ++ для проекта, над которым я работал. То, что я до сих пор не понимаю, это соединение BLAS и LAPACK с другими библиотеками линейной алгебры. Просматривая эту статью о библиотеках линейной алгебры, я обнаружил, что интересно: некоторые библиотеки независимы от...

17
Гарантируются ли реализации BLAS одинаковыми результатами?

Учитывая две разные реализации BLAS, можем ли мы ожидать, что они будут делать одни и те же вычисления с плавающей запятой и возвращать одинаковые результаты? Или может случиться, например, что скалярное произведение вычисляется как а один - как ( x 1 y 1 + x 2 y 2 ) + ( х 3 у 3 + х 4( ( х1Y1+...

16
Евклидово расстояние в Октаве

Я хотел бы знать, есть ли быстрый способ вычисления евклидова расстояния двух векторов в октаве. Кажется, что для этого нет специальной функции, так что я должен просто использовать формулу с...

15
Почему не мое матрично-векторное масштабирование?

Извините за длинный пост, но я хотел включить все, что я думал, было актуально с первого взгляда. Что я хочу Я реализую параллельную версию методов подпространств Крылова для плотных матриц. В основном GMRES, QMR и CG. Я понял (после профилирования), что моя рутина DGEMV была жалкой. Поэтому я...

14
Насколько полезен PETSc для плотных матриц?

Везде, где я видел, учебник / документы PETSc и т. Д. Говорят, что это полезно для линейной алгебры и обычно указывает, что разреженные системы принесут пользу. Как насчет плотных матриц? Я обеспокоен тем, о решении для плотного .AAx=bAx=bAx=bAAA Я написал свой собственный код для CG и QMR на...

11
Каковы наиболее быстрые доступные реализации BLAS / LAPACK или других подпрограмм линейной алгебры в системах с графическим процессором?

Например, у nVidia есть CUBLAS, который обещает ускорение в 7-14 раз. Наивно, это далеко не теоретическая пропускная способность любой из видеокарт nVidia. Каковы проблемы в ускорении линейной алгебры на графических процессорах, и есть ли уже доступные более быстрые линейные алгебраические...

11
Есть ли в C / C ++ реализация BLAS на базовом уровне?

Реализация netlib BLAS является отличным эталоном, поскольку в большинстве случаев она неоптимизирована и хорошо документирована (например, zgemm ). Тем не менее, это в Fortran 77, что делает его несколько недоступным для людей с более современным образованием в области программирования. Есть ли в...

11
Опасность сложной арифметики в научных вычислениях

Комплекс скалярное произведение имеет два различных определений решает условные обозначения : · ¯u T V или ¯u T ° V . В BLAS я нашел подпрограммы cdotu, zdotu и cdotc, zdotc. Первые две подпрограммы фактически вычисляют u T v (поддельное внутреннее произведение!), А последние две подпрограммы...

10
Использует ли когда-нибудь PETSc библиотеки LAPACK для математики с разреженной матрицей?

Влияет ли компиляция PETSc с внешней библиотекой BLAS / LAPACK существенным образом на производительность разреженных матриц, или он использует эти библиотеки только для математики с плотной...