Что нужно, чтобы сделать GPU полностью питаемым процессором?
Сравнения их флопов / с достаточно?
Например, если бы мне удалось создать очень старый (Pentium-3) процессор с одним из графических процессоров Nvidia-Fermi, он не смог бы снабжать графический процессор данными в секунду. Каковы критерии для соответствия CPU и GPU, когда требуется OpenCL или аналогичная работа?
Конечно, RAM и BUS будут выбраны одинаково, но как именно?
Предположим, что каждое ядро GPU будет вычислять sqrt, деление и сложение 100 раз за каждую итерацию.
Благодарю.
Редактировать: После работы с opencl в течение многих лет, кажется, что это в основном зависит от алгоритма, а затем от оптимизаций связи (чтение / запись или сопоставление / отображение) и пиковых вычисляемых значений gpus и его способности выполнять чтение + запись + вычисления в одном и том же отрезке времени. Аппаратное обеспечение просто умножает уровень производительности этих параметров (те, которые могут экспоненциально изменять производительность).
Единственного ответа не существует, здесь задействовано гораздо больше факторов, так как простая подача информации также будет зависеть от того, что будет выполнять стоящая перед вами задача.
Короче говоря, желательно несколько ядер с высокой тактовой частотой.
источник