Программно получить размер строки кэша?

177

Все платформы приветствуются, пожалуйста, укажите платформу для вашего ответа.

Аналогичный вопрос: как программно получить размер страницы кэша процессора в C ++?

paxos1977
источник
8
FWIW, C ++ 17 обеспечит приблизительное время компиляции этого: stackoverflow.com/questions/39680206/…
GManNickG
Кроме C / C ++, если вы не возражаете против использования ассемблера для получения такой информации, вы можете взглянуть (расширив информацию из ответа Негамартина) на исходный код SDL_GetCPUCacheLineSizeфункции SDL2 , а затем взглянуть на то, у кого cpuid macroесть исходный код сборки для каждого из них. модели процессора. Вы можете взглянуть на imgur.com/a/KP57m6s или непосредственно взглянуть на источник самостоятельно.
haxpor

Ответы:

186

В Linux (с относительно новым ядром) вы можете получить эту информацию из / sys:

/sys/devices/system/cpu/cpu0/cache/

Этот каталог имеет подкаталог для каждого уровня кэша. Каждый из этих каталогов содержит следующие файлы:

coherency_line_size
level
number_of_sets
physical_line_partition
shared_cpu_list
shared_cpu_map
size
type
ways_of_associativity

Это дает вам больше информации о кеше, чем вы когда-либо надеялись узнать, включая размер строки кэша ( coherency_line_size), а также то, какие процессоры совместно используют этот кеш. Это очень полезно, если вы выполняете многопоточное программирование с общими данными (вы получите лучшие результаты, если потоки, совместно использующие данные, также совместно используют кэш).

spinfire
источник
4
какой из файлов содержит размер строки кэша? Я предполагаю, coherency_line_size? или физическая_линя_раздела?
paxos1977
27
coherency_line_size
spinfire
6
Чтобы быть уверенным: это в байтах, да?
Якуб М.
6
Да, coherency_line_size находится в байтах.
Джон Цвинк
4
@android: Я использую машину fedora-18 x64 с процессором core-i5. cat /sys/devices/system/cpu/cpu0/cache/index0/coherency_line_sizeвозвращается 64в мою систему. То же самое для папок index1,2,3.
Абид Рахман K
141

В Linux посмотрите на sysconf (3).

sysconf (_SC_LEVEL1_DCACHE_LINESIZE)

Вы также можете получить его из командной строки, используя getconf:

$ getconf LEVEL1_DCACHE_LINESIZE
64
об. Об.
источник
4
простые ответы - просто лучшие!
ФрэнкХ.
3
@warunapww Это в байтах.
Мартен Бамелис
Ну наконец то! надеюсь, что больше парней увидят этот ответ для экономии времени.
elinx
118

Я работал над некоторыми строками кеша и мне нужно было написать кроссплатформенную функцию. Я отправил его в репозиторий github по адресу https://github.com/NickStrupat/CacheLineSize , или вы можете просто использовать приведенный ниже источник. Не стесняйтесь делать все, что вы хотите с ним.

#ifndef GET_CACHE_LINE_SIZE_H_INCLUDED
#define GET_CACHE_LINE_SIZE_H_INCLUDED

// Author: Nick Strupat
// Date: October 29, 2010
// Returns the cache line size (in bytes) of the processor, or 0 on failure

#include <stddef.h>
size_t cache_line_size();

#if defined(__APPLE__)

#include <sys/sysctl.h>
size_t cache_line_size() {
    size_t line_size = 0;
    size_t sizeof_line_size = sizeof(line_size);
    sysctlbyname("hw.cachelinesize", &line_size, &sizeof_line_size, 0, 0);
    return line_size;
}

#elif defined(_WIN32)

#include <stdlib.h>
#include <windows.h>
size_t cache_line_size() {
    size_t line_size = 0;
    DWORD buffer_size = 0;
    DWORD i = 0;
    SYSTEM_LOGICAL_PROCESSOR_INFORMATION * buffer = 0;

    GetLogicalProcessorInformation(0, &buffer_size);
    buffer = (SYSTEM_LOGICAL_PROCESSOR_INFORMATION *)malloc(buffer_size);
    GetLogicalProcessorInformation(&buffer[0], &buffer_size);

    for (i = 0; i != buffer_size / sizeof(SYSTEM_LOGICAL_PROCESSOR_INFORMATION); ++i) {
        if (buffer[i].Relationship == RelationCache && buffer[i].Cache.Level == 1) {
            line_size = buffer[i].Cache.LineSize;
            break;
        }
    }

    free(buffer);
    return line_size;
}

#elif defined(linux)

#include <stdio.h>
size_t cache_line_size() {
    FILE * p = 0;
    p = fopen("/sys/devices/system/cpu/cpu0/cache/index0/coherency_line_size", "r");
    unsigned int i = 0;
    if (p) {
        fscanf(p, "%d", &i);
        fclose(p);
    }
    return i;
}

#else
#error Unrecognized platform
#endif

#endif
Ник Струпат
источник
15
Возможно, лучше использовать sysconf (_SC_LEVEL1_DCACHE_LINESIZE) для Linux.
Мэтт
@ Матт почему? Просто любопытно :-).
user35915
31

На x86 вы можете использовать инструкцию CPUID с функцией 2 для определения различных свойств кэша и TLB. Анализ выходных данных функции 2 несколько сложен, поэтому я отсылаю вас к разделу 3.1.3 « Идентификация процессора Intel» и «Инструкция CPUID» (PDF).

Чтобы получить эти данные из кода C / C ++, вам потребуется использовать встроенную сборку, встроенные функции компилятора или вызвать функцию внешней сборки для выполнения инструкции CPUID.

Адам Розенфилд
источник
Кто-нибудь знает о том, как это сделать с другими процессорами со встроенным кешем?
paxos1977
3
@ceretullis: Errr ... x86 имеет встроенный кеш. Какие "другие процессоры" вы специально ищете? То, что вы просите, зависит от платформы.
Билли ОНил
9

Если вы используете SDL2, вы можете использовать эту функцию:

int SDL_GetCPUCacheLineSize(void);

Который возвращает размер строки кэша L1 в байтах.

На моем компьютере с архитектурой x86_64 выполняется следующий фрагмент кода:

printf("CacheLineSize = %d",SDL_GetCPUCacheLineSize());

Производит CacheLineSize = 64

Я знаю, что немного опаздываю, но просто добавляю информацию для будущих посетителей. Документация SDL в настоящее время говорит, что возвращаемое число находится в КБ, но на самом деле это в байтах.

negamartin
источник
О, это действительно полезно. Я собираюсь написать какую-нибудь игру на SDL2, так что это будет очень полезно
Николас Хамфри
7

На платформе Windows:

от http://blogs.msdn.com/oldnewthing/archive/2009/12/08/9933836.aspx

Функция GetLogicalProcessorInformation предоставит вам характеристики логических процессоров, используемых системой. Вы можете просмотреть SYSTEM_LOGICAL_PROCESSOR_INFORMATION, возвращаемую функцией, для поиска записей типа RelationCache. Каждая такая запись содержит ProcessorMask, который сообщает вам, к какому процессору (-ам) относится данная запись, а в CACHE_DESCRIPTOR он сообщает, какой тип кэша описывается и насколько велика строка кэша для этого кэша.

Лоренцо Боккачча
источник
4

ARMv6 и выше имеет C0или регистр типа кэша. Тем не менее, он доступен только в привилегированном режиме.

Например, из Технического справочного руководства Cortex ™ -A8 :

Назначение регистра типа кэша состоит в том, чтобы определить минимальную длину строки команд и кэша данных в байтах, чтобы разрешить аннулирование диапазона адресов.

Регистр типа кэша:

  • регистр только для чтения
  • доступно только в привилегированных режимах.

Содержимое регистра типа кэша зависит от конкретной реализации. Рисунок 3-2 показывает расположение битов регистра типа кэша ...


Не думайте, что процессор ARM имеет кеш (очевидно, некоторые могут быть настроены без него). Стандартный способ определить это через C0. От ARM ARM , стр. B6-6:

В ARMv6 регистр типа кэша сопроцессора управления системой является обязательным методом для определения кэшей L1, см. Регистр типа кэша на стр. B6-14. Это также рекомендуемый метод для более ранних вариантов архитектуры. Кроме того, Рекомендации по дополнительным уровням кэша на стр. B6-12 описывают рекомендации по архитектуре для поддержки уровня 2 кэша.

оборота
источник
3

Вы также можете попытаться сделать это программно, измерив некоторое время. Очевидно, что он не всегда будет таким же точным, как cpuid и т.п., но он более переносим. ATLAS делает это на этапе настройки, вы можете посмотреть на это:

http://math-atlas.sourceforge.net/

Дэвид Курнапо
источник