Вопросы с тегом «performance»

12
Какой самый быстрый способ вычислить все собственные значения очень большой и разреженной матрицы смежности в python?

Я пытаюсь выяснить, существует ли более быстрый способ вычисления всех собственных значений и собственных векторов очень большой и разреженной матрицы смежности, чем использование scipy.sparse.linalg.eigsh. Насколько я знаю, этот метод использует только разреженность и атрибуты симметрии матрицы....

12
В каких случаях применения схемы аддитивного прекондиционирования превосходят мультипликативные?

Как в методах декомпозиции доменов (DD), так и в многосеточных (MG) можно применять применение блочных обновлений или грубых исправлений как аддитивное или мультипликативное . Для точечных решателей это различие между итерациями Якоби и Гаусса-Зейделя. Мультипликативный сглаживатель для действующий...

12
Октава: вычислить расстояние между двумя матрицами векторов

Предположим, у меня есть две матрицы Nx2, Mx2, представляющие N, M 2d векторов соответственно. Есть ли простой и хороший способ рассчитать расстояния между каждой векторной парой (n, m)? Простой, но неэффективный способ, конечно: d = zeros(N, M); for i = 1:N, for j = 1:M, d(i,j) = norm(n(i,:) -...

11
Статистические модели для локальной памяти / вычислений, задержки в сети и дрожания полосы пропускания в HPC

Параллельные вычисления часто моделируются с использованием детерминированной локальной скорости вычислений, времени ожидания и пропускной способности сети. На самом деле, они пространственно переменные и недетерминированные. Такие исследования, как Skinner и Kramer (2005), наблюдают...

11
Как реализовать эффективную функцию индексации для двухчастичных интегралов <ij | kl>?

Это простая задача перечисления симметрии. Я даю полный обзор, но знание квантовой химии не требуется. Двухчастичный интеграл : И имеет следующие 4 симметрии: У меня есть функция, которая вычисляет интеграл и сохраняет его в одномерном массиве , проиндексированном следующим образом:⟨ я J | к л ⟩ =...

11
Какова основная структура производительности научного кода?

Рассмотрим два компьютера с разными аппаратными и программными конфигурациями. При запуске одного и того же последовательного кода Навье-Стокса на каждой платформе требуется x и y время для выполнения одной итерации для компьютеров 1 и 2 соответственно. В этом случае - это разница во времени...

10
Литературные ссылки для моделирования текущих и будущих затрат энергии на операции с плавающей запятой и передачу данных

Я ищу самую важную литературу и ссылки на слайды для моделирования текущих и будущих затрат энергии на операции с плавающей запятой и передачу данных через ЦП, память, сеть и хранилище. Я пометил этот вопрос как вики сообщества, и я бы предпочел, чтобы вы ограничивали каждый ответ следующим...

10
Каковы издержки при умножении разреженных матриц

Умножается ли матричное умножение (как Mat * Mat, так и Mat * Vec) на количество ненулевых элементов или на размер матрицы? Или какая-то комбинация двух. Как насчет формы. Например, у меня есть матрица 100 x 100 с 100 значениями в ней или матрица 1000 x 1000 с 100 значениями в ней. При возведении в...

10
Каково влияние семантики перемещения C ++ 11 в контексте научных вычислений?

C ++ 11 вводит семантику перемещения, которая может, например, улучшить производительность кода в ситуациях, когда C ++ 03 потребуется выполнить конструкцию копирования или назначение копирования. В этой статье сообщается, что при компиляции с C + 11 следующий код ускоряется в 5 раз:...

10
Матричное умножение MATLAB (лучший вычислительный подход)

Я должен сделать преобразование координат между двумя системами отсчета (осями). Для этого необходимо умножить три матрицы ( ) из-за использования некоторых промежуточных осей. Я думал о двух подходах, чтобы решить эту проблему:3×33×33\times3 Способ № 1 : Выполнение умножения напрямую, то есть...

10
Nvidia K20X против GeForce Titan для ускорения GPGPU

Я пытаюсь понять разницу между этими двумя видеокартами для академических вычислений, особенно для компонента DGEMM. Если мы посмотрим на необработанные статистические данные, оба имеют одинаковый чип GK110, имеют сопоставимые статистические данные практически во всех категориях и, как мне кажется,...

9
Самый быстрый способ найти собственные пары малой несимметричной матрицы на GPU в разделяемой памяти

У меня есть проблема, когда мне нужно найти все положительные (так как собственное значение положительно) собственные пары небольшой (обычно меньше, чем 60x60) несимметричной матрицы. Я могу прекратить вычислять, когда собственное значение меньше определенного порога. Я знаю, что собственные...