Вопросы с тегом «gpu»

25
Какова стоимость смены государства?

Предполагается, что у программистов есть достаточно хорошее представление о стоимости определенных операций: например, о стоимости инструкций по ЦП, о потере кэша L1, L2 или L3, о стоимости LHS. Когда дело доходит до графики, я понимаю, что понятия не имею, что это такое. Я имею в виду, что если мы...

19
Почему рекурсия запрещена в OpenCL?

Я бы хотел использовать OpenCL для ускорения рендеринга изображений с трассировкой лучей, но я заметил, что на странице Википедии утверждается, что рекурсия запрещена в Open CL. Это правда? Поскольку я широко использую рекурсию при трассировке лучей, для ее ускорения потребуется значительное...

16
Почему у нас есть графические фреймворки, такие как OpenGL и DirectX, когда игры могут просто рисовать пиксели напрямую?

Игры и другие графически насыщенные приложения используют такие платформы, как OpenGL и DirectX. Также им требуются такие функции, как пиксельный шейдер и DX12. Но зачем нам все эти фреймворки и функции GPU, когда мы можем просто рисовать все пиксель за пикселем? Во-первых, игру нужно будет...

14
Почему графические процессоры все еще имеют растеризаторы?

Несмотря на достижения, современные графические процессоры все еще имеют фиксированные растеризаторы. Настраиваемый, с программируемыми шейдерами, но не полностью программируемый. Это почему? Почему графические процессоры не могут быть просто массово параллельными устройствами с универсальными...

14
Текстуры поиска все еще используются для чего-либо?

Я не так давно (5-10 лет?) Знал, что было популярно / эффективно запекать данные в текстуры, а затем считывать данные из текстур, часто используя встроенную интерполяцию текстур, чтобы получить линейную интерполяцию запеченных. данные. Теперь, когда время вычислений дешевле по сравнению со временем...

14
Как анизотропная фильтрация обычно реализуется в современных графических процессорах?

Анизотропная фильтрация «сохраняет резкость текстуры, которая обычно теряется при попытках текстуры карты MIP избежать наложения». Статья в Википедии дает подсказки о том, как ее можно реализовать («исследовать текстуру (...) для любой ориентации анизотропии»), но она мне не очень понятна. Кажется,...

13
Почему эффективность работы желательна в программировании на GPU?

Я читал следующую статью о том, как сделать параллельное сканирование в CUDA: https://developer.nvidia.com/gpugems/GPUGems3/gpugems3_ch39.html В статье делается акцент на том, чтобы сделать сканирование «эффективным». Другими словами, алгоритм GPU должен выполнять не больше дополнений, чем алгоритм...

12
Синхронизация последовательных вызовов OpenGL Compute Shader

У меня есть пара вычислительных шейдеров, которые должны быть выполнены в определенном порядке и чьи выходные данные зависят от предыдущих входных данных. В идеале мне никогда не понадобится копировать буфер на стороне клиента и выполнять всю мою работу на GPU. Рассмотрим У меня есть два...

11
Почему соседние треугольники никогда не перекрываются при растеризации?

Извиняюсь за следующий нубский вопрос, просто я нигде не могу найти удовлетворительный ответ ... Когда я рендерил простой выровненный по оси четырехугольник, состоящий из двух треугольников, я не понимаю, почему на диагональном ребре, где встречаются эти треугольники, никогда не бывает видимых...

11
Чего ждет мой графический процессор?

Я пишу программу OpenCL для использования с моим графическим процессором AMD Radeon HD 7800 серии. Согласно руководству по программированию AMD OpenCL , это поколение GPU имеет две аппаратные очереди, которые могут работать асинхронно. 5.5.6 Очередь команд Для Южных островов и более поздних версий...

11
Сколько полигонов в сцене может достичь современное оборудование, поддерживая в режиме реального времени, и как туда добраться?

Довольно простой, в некотором смысле, вопрос, но тот, на который многие люди, в том числе и я, на самом деле не знают ответа. Производители графических процессоров часто ссылаются на чрезвычайно высокие цифры, а разброс между полигонами, который, как утверждают разные игровые движки, часто...

10
Почему AMD, установившая SSD на плату GPU, так сильно уменьшила задержки?

AMD недавно была в новостях с интересной платой Radeon Pro с парой твердотельных накопителей M2. Как отмечают некоторые из более подробных историй (например, здесь или здесь ), преимущества могут быть в основном получены не за счет высокой пропускной способности (у M2 только по 4 линии PCIe каждая,...

9
Оптимальный доступ к памяти при использовании справочных таблиц на GPU?

Я изучаю изоповерхностные алгоритмы на графическом процессоре для проекта бакалавра (особенно концентрируясь только на двоичных входных / выходных данных вокселей, а не на полях с действительными значениями). Итак, у меня есть реализация CPU старых добрых марширующих кубов, запущенная в...

9
Расчет на вершину в тесселяции OpenGL

Я пытаюсь реализовать позиционное моделирование одежды с использованием аппаратного тесселяции. Это означает, что я хочу просто загрузить контрольный квад на графическую карту, а затем использовать тесселяцию и затенение геометрии для создания узлов в ткани. Эта идея следует за бумагой: Huynh,...

9
Создание общих вершинных нормалей на GPU

Я в основном преуспел в переносе реализации Marching Cubes с CPU на вычислительные шейдеры OpenGL, но я еще не справился с нормой и задаюсь вопросом, как лучше это сделать. Моя реализация имеет дело именно с бинарными полями (я пытаюсь смоделировать трехмерные фрактальные функции, у которых пока...

9
Как работает Texture Cache в Tile Based Rendering GPU

Как кеш работает с рендерингом на основе плиток? Есть ли какие-нибудь советы, как улучшить коэффициент попадания в кеш? (например, если плитки обрабатываются горизонтально, и у меня есть вертикальные сегменты треугольников с одинаковой текстурой, будет ли это хуже для кеша, чем если бы я располагал...

9
Самый эффективный способ организации вершинных данных на современных графических процессорах

Скажем , у меня есть модель , составленная из вершин, каждый из которых position, normal, tangentи texcoordатрибутов, где треугольники указанных индексов троек. Если мы просто сосредоточимся на атрибутах вершин, мне известны две широкие стратегии: структура массивов и массив структур. Я также...

8
Выполняются ли вызовы отрисовки параллельно, последовательно или одновременно?

Это продолжение вопроса, на который я ответил на GameDev SE. Вопрос заключался в том, является ли glDrawArraysInstanced в OpenGL параллельным при рисовании этих экземпляров? Мой ответ был в следующих строках: «Графический процессор может выполнять несколько вызовов отрисовки параллельно в...

8
Современные графические процессоры содержат бочкообразные переключатели?

Мне известно, что большинство современных графических процессоров, хотя и рассчитаны на использование чисел с плавающей запятой, в наши дни более или менее эквивалентны по целочисленной производительности, за исключением нескольких предостережений, таких как отсутствие плавного умножения. Я не...