Вопрос в том, что вы подразумеваете под флопами? Если все, что вас волнует, это сколько простейших операций с плавающей запятой за такт, это, вероятно, в 3 раза больше вашей тактовой частоты, но это примерно так же бессмысленно, как bogomips. Некоторые операции с плавающей запятой занимают много времени (деление, для начинающих), сложение и умножение обычно бывают быстрыми (по одному на единицу fp за такт). Следующая проблема - производительность памяти, есть причина, по которой в последнем классическом CRAY было 31 банк памяти. В конечном счете, производительность процессора ограничена скоростью чтения и записи в память, так какой уровень кэширования подходит для вашей проблемы? Когда-то Linpack был настоящим эталоном, теперь он помещается в кеш (L2, если не L1) и является скорее чисто теоретическим эталоном CPU. И, конечно, ваши SSE (и т. Д.) Также могут повысить производительность с плавающей запятой.
В каком дистрибутиве вы работаете?
Это выглядело как хороший указатель: http://linuxtoolkit.blogspot.com/2009/04/intel-optimized-linpack-benchmark-for.html
http://onemansjourneyintolinux.blogspot.com/2008/12/show-us-yer-flops.html
http://www.phoronix-test-suite.com/ может быть более простым способом установки теста флопа.
И все же я удивляюсь, почему тебя это волнует, для чего ты это используешь? Если вы просто хотите получить бессмысленное число, ваши системные bogomips все еще находятся в dmesg.
по-видимому, есть пакет и команда «sysbench»:
sudo apt-get install sysbench
(илиbrew install sysbench
OS X)запустите это так:
sysbench --test=cpu --cpu-max-prime=20000 --num-threads=2 run
вывод для сравнения:
ссылка: http://www.midwesternmac.com/blogs/jeff-geerling/2013-vps-benchmarks-linode
источник
Для приблизительных оценок:
Raspberry Pi 2 : 299,93 * 10 ^ 6 FLOPS ( источник )
Raspberry Pi 3: 462,07 * 10 ^ 6 FLOPS ( источник )
Linpack
cd benchmarks_2017/linux/mkl/benchmarks/linpack
./runme_xeon64
На Thinkpad T460p ( процессор Intel i7-6700HQ ) это дает:
источник
Одним из эталонов, который традиционно использовался для измерения FLOPS, является Linpack. Другим распространенным эталоном FLOPS является Whetstone.
Больше чтения: Википедия «вьетнамки» запись , точильный запись , Linpack запись
источник
Я настоятельно рекомендую готовую сборку linpack от Intel: http://software.intel.com/en-us/articles/intel-math-kernel-library-linpack-download/
источник
Как вы упомянули кластер, мы использовали пакет HPCC . Требуется немного усилий для настройки и настройки, но в нашем случае эта точка зрения не была хвастливой, она была частью критериев приемлемости для кластера; ИМХО необходим некоторый сравнительный анализ производительности, чтобы гарантировать, что оборудование работает так, как рекламируется, все правильно соединено и т. д.
Теперь, если вы просто хотите получить теоретическое пиковое число FLOPS, это просто. Просто посмотрите статью о процессоре (скажем, на realworldtech.com или что-то подобное), чтобы получить информацию о том, сколько DP FLOPS может сделать ядро процессора за такт (с текущими процессорами x86, которые обычно равны 4). Тогда общий пик FLOPS просто
количество ядер * FLOPS / цикл * частота
Тогда для кластера с сетью IB вы сможете достичь около 80% пикового значения FLOPS в HPL (что, кстати, является одним из эталонов в HPCC).
источник