繁体   English   中英

以编程方式获取缓存行大小?

[英]Programmatically get the cache line size?

欢迎所有平台,请指定您回答的平台。

一个类似的问题: How to programmatically get the CPU cache page size in C++?

在 Linux(具有相当新的内核)上,您可以从 /sys 中获取此信息:

/sys/devices/system/cpu/cpu0/cache/

该目录对每一级缓存都有一个子目录。 这些目录中的每一个都包含以下文件:

coherency_line_size
level
number_of_sets
physical_line_partition
shared_cpu_list
shared_cpu_map
size
type
ways_of_associativity

这为您提供了有关缓存的更多信息,然后您希望知道,包括缓存线大小 ( coherency_line_size ) 以及哪些 CPU 共享此缓存。 如果您正在使用共享数据进行多线程编程,这非常有用(如果共享数据的线程也共享缓存,您将获得更好的结果)。

在 Linux 上查看 sysconf(3)。

sysconf (_SC_LEVEL1_DCACHE_LINESIZE)

您也可以使用 getconf 从命令行获取它:

$ getconf LEVEL1_DCACHE_LINESIZE
64

我一直在研究一些缓存线的东西,需要编写一个跨平台的函数。 我将它提交给https://github.com/NickStrupat/CacheLineSize的 github 存储库,或者您可以使用下面的源代码。 随意用它做任何你想做的事。

#ifndef GET_CACHE_LINE_SIZE_H_INCLUDED
#define GET_CACHE_LINE_SIZE_H_INCLUDED

// Author: Nick Strupat
// Date: October 29, 2010
// Returns the cache line size (in bytes) of the processor, or 0 on failure

#include <stddef.h>
size_t cache_line_size();

#if defined(__APPLE__)

#include <sys/sysctl.h>
size_t cache_line_size() {
    size_t line_size = 0;
    size_t sizeof_line_size = sizeof(line_size);
    sysctlbyname("hw.cachelinesize", &line_size, &sizeof_line_size, 0, 0);
    return line_size;
}

#elif defined(_WIN32)

#include <stdlib.h>
#include <windows.h>
size_t cache_line_size() {
    size_t line_size = 0;
    DWORD buffer_size = 0;
    DWORD i = 0;
    SYSTEM_LOGICAL_PROCESSOR_INFORMATION * buffer = 0;

    GetLogicalProcessorInformation(0, &buffer_size);
    buffer = (SYSTEM_LOGICAL_PROCESSOR_INFORMATION *)malloc(buffer_size);
    GetLogicalProcessorInformation(&buffer[0], &buffer_size);

    for (i = 0; i != buffer_size / sizeof(SYSTEM_LOGICAL_PROCESSOR_INFORMATION); ++i) {
        if (buffer[i].Relationship == RelationCache && buffer[i].Cache.Level == 1) {
            line_size = buffer[i].Cache.LineSize;
            break;
        }
    }

    free(buffer);
    return line_size;
}

#elif defined(linux)

#include <stdio.h>
size_t cache_line_size() {
    FILE * p = 0;
    p = fopen("/sys/devices/system/cpu/cpu0/cache/index0/coherency_line_size", "r");
    unsigned int i = 0;
    if (p) {
        fscanf(p, "%d", &i);
        fclose(p);
    }
    return i;
}

#else
#error Unrecognized platform
#endif

#endif

在 x86 上,您可以使用带有函数 2 的CPUID指令来确定缓存和 TLB 的各种属性。 解析函数 2 的输出有些复杂,所以我将向您介绍Intel 处理器标识和 CPUID 指令 (PDF) 的第 3.1.3 节。

要从 C/C++ 代码中获取此数据,您需要使用内联汇编、编译器内在函数或调用外部汇编函数来执行 CPUID 指令。

如果您使用的是 SDL2,则可以使用此功能:

int SDL_GetCPUCacheLineSize(void);

它返回 L1 缓存行大小的大小,以字节为单位。

在我的 x86_64 机器上,运行以下代码片段:

printf("CacheLineSize = %d",SDL_GetCPUCacheLineSize());

产生CacheLineSize = 64

我知道我有点晚了,但只是为未来的访客添加信息。 SDL 文档目前说返回的数字以 KB 为单位,但实际上以字节为单位。

在 Windows 平台上:

来自http://blogs.msdn.com/oldnewthing/archive/2009/12/08/9933836.aspx

GetLogicalProcessorInformation 函数将为您提供系统使用的逻辑处理器的特征。 您可以遍历函数返回的 SYSTEM_LOGICAL_PROCESSOR_INFORMATION,查找类型为 RelationCache 的条目。 每个这样的条目都包含一个 ProcessorMask,它告诉您该条目适用于哪个处理器,并且在 CACHE_DESCRIPTOR 中,它告诉您正在描述什么类型的缓存以及该缓存的缓存行有多大。

ARMv6及以上有C0或Cache Type Register。 但是,它仅在特权模式下可用。

例如,来自Cortex™-A8 技术参考手册

高速缓存类型寄存器的目的是确定指令和数据高速缓存的最小行长度(以字节为单位),以使地址范围无效。

缓存类型寄存器是:

  • 只读寄存器
  • 只能在特权模式下访问。

Cache Type Register 的内容取决于具体的实现。 图 3-2 显示了缓存类型寄存器的位排列...


不要假设 ARM 处理器有缓存(显然,有些可以没有缓存)。 确定它的标准方法是通过C0 ARM ARM ,第 B6-6 页:

从 ARMv6 开始,系统控制协处理器缓存类型寄存器是定义 L1 缓存的强制方法,请参阅第 B6-14 页的缓存类型寄存器。 对于早期的架构变体,这也是推荐的方法。 此外,第 B6-12 页上的额外缓存级别的注意事项描述了 2 级缓存支持的体系结构指南。

从 C++17 开始,您可以使用std::hardware_破坏性_interference_size
其定义为:

两个对象之间的最小偏移量,以避免错误共享。 保证至少是 alignof(std::max_align_t)

您也可以尝试通过测量一些时间以编程方式进行。 显然,它并不总是像 cpuid 之类的那样精确,但它更便携。 ATLAS 在其配置阶段执行此操作,您可能需要查看它:

http://math-atlas.sourceforge.net/

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM