Вопросы с тегом «gpu»

Блок графической обработки - специализированный, относительно недорогой аппаратный блок, созданный для быстрых графических вычислений и научных вычислений с высокой степенью параллелизма данных.

84
Какие проблемы хорошо подходят для вычислений на GPU?

Так что я неплохо разбираюсь в том, какие проблемы, с которыми я работаю, являются лучшими в сериале, и которыми можно управлять параллельно. Но сейчас у меня нет особого представления о том, что лучше всего обрабатывать вычислениями на базе ЦП, и что следует выгружать в графический процессор. Я...

34
CUDA против OpenCL по состоянию на конец 2013 года

Как CUDA и OpenCL сравниваются друг с другом в конце 2013 года с точки зрения программиста? Моя группа думает о том, чтобы попытаться использовать вычисления на GPU. Будем ли мы значительно ограничивать себя, выбирая оборудование, которое поддерживает только OpenCL, но не CUDA? Чтобы быть более...

18
Для каких статистических методов GPU быстрее, чем CPU?

Я только что установил графическую карту Nvidia GT660 на свой рабочий стол, и после некоторой борьбы мне удается связать ее с R. Я играл с несколькими R-пакетами, использующими графические процессоры, особенно gputools, и сравнивал время, затрачиваемое моим GPU и процессором на выполнение некоторых...

17
Поддерживают ли доступные в настоящее время графические процессоры двойной точности с плавающей запятой?

Я запускал код молекулярной динамики (MD) GROMACS на кластере Ubuntu Linux, состоящем из узлов, содержащих 24 процессора Intel Xeon. Моя конкретная достопримечательность оказывается несколько чувствительной к арифметической точности с плавающей запятой, поэтому мне пришлось запускать GROMACS с...

16
Евклидово расстояние в Октаве

Я хотел бы знать, есть ли быстрый способ вычисления евклидова расстояния двух векторов в октаве. Кажется, что для этого нет специальной функции, так что я должен просто использовать формулу с...

15
Варианты решения систем ODE на графических процессорах?

Я хотел бы вывести системы решения ODE на графические процессоры в «тривиально распараллеливаемой» обстановке. Например, анализ чувствительности с 512 различными наборами параметров. В идеале я хочу решать ODE с помощью интеллектуального адаптивного временного шага, такого как CVODE, а не с...

14
Научные вычисления на Python с современными графическими процессорами с двойной точностью

Кто-нибудь здесь использовал научные вычисления двойной точности с графическими процессорами нового поколения (например, K20) через Python? Я знаю, что эта технология быстро развивается, но каков наилучший способ сделать это в настоящее время? GPU не входит в число популярных научных библиотек...

12
Параллельные (GPU) алгоритмы для асинхронных клеточных автоматов

У меня есть коллекция вычислительных моделей, которые можно описать как асинхронные клеточные автоматы. Эти модели напоминают модель Изинга, но немного сложнее. Кажется, что такие модели выиграли бы от работы на GPU, а не на CPU. К сожалению, распараллелить такую ​​модель довольно непросто, и мне...

11
Каковы наиболее быстрые доступные реализации BLAS / LAPACK или других подпрограмм линейной алгебры в системах с графическим процессором?

Например, у nVidia есть CUBLAS, который обещает ускорение в 7-14 раз. Наивно, это далеко не теоретическая пропускная способность любой из видеокарт nVidia. Каковы проблемы в ускорении линейной алгебры на графических процессорах, и есть ли уже доступные более быстрые линейные алгебраические...

10
Тяга для программирования на GPU

Я очень новичок в программировании GPGPU, поэтому, пожалуйста, прости меня, если вопрос не особенно уместен. Из того, что я понимаю, программирование на GPU - очень сложная часть инженерной работы по сравнению с обычным программированием на CPU. Нужно быть очень осторожным в вопросах расхождения,...

10
Nvidia K20X против GeForce Titan для ускорения GPGPU

Я пытаюсь понять разницу между этими двумя видеокартами для академических вычислений, особенно для компонента DGEMM. Если мы посмотрим на необработанные статистические данные, оба имеют одинаковый чип GK110, имеют сопоставимые статистические данные практически во всех категориях и, как мне кажется,...

9
Самый быстрый способ найти собственные пары малой несимметричной матрицы на GPU в разделяемой памяти

У меня есть проблема, когда мне нужно найти все положительные (так как собственное значение положительно) собственные пары небольшой (обычно меньше, чем 60x60) несимметричной матрицы. Я могу прекратить вычислять, когда собственное значение меньше определенного порога. Я знаю, что собственные...

9
Параллельное вычисление больших ковариационных матриц

Нам нужно вычислить ковариационные матрицы с размерами от до . У нас есть доступ к графическим процессорам и кластерам, мы задаемся вопросом, каков наилучший параллельный подход для ускорения этих...