繁体 English 中英

如何用C编写程序来测量缓存的速度？

[英]How to write a program in C to measure the speed of cache?

原文 2013-04-26 17:34:11 4 3 c/ caching

编写程序并尝试比较（测量，如果可以）从主存和高速缓存访问数据的时间。

如果你能做到，那么如何衡量每级缓存的速度？

3 个解决方案

您需要提出一种启发式方法，强制100％（或非常接近）缓存未命中（希望您有缓存失效操作码？）和100％缓存命中。 Hooray，适用于1级缓存。 现在，如何对2级和3级做同样的事情？

严肃地说，如果没有连接到CPU和内存的特殊硬件和跟踪，可能没有办法100％可靠地完成这项工作，但这就是我要做的事情：

将一堆“东西”写入内存中的1个位置 - 足以让您确定它是一致地命中L1缓存并记录时间（这会影响缓存，所以要小心）。 你应该在没有分支的情况下进行这组写操作，以试图摆脱分支预测的不一致性。 那是最好的时间。 现在，每隔一段时间，将缓存行的数据写入已知位置末尾的RAM中的随机远程位置并记录新时间。 希望这需要更长的时间。 在不同时间继续进行此录制，希望您会看到几个倾向于分组的时间。 这些组中的每一个“都可以”显示L2，L3和存储器访问时序的时序。 问题是还有很多其他的东西妨碍了。 操作系统可以上下文切换你并搞砸你的缓存。 中断可能会出现并通过你的时间关闭。 会有很多东西可以抛弃这些价值。 但是，希望您在数据中获得足够的信号以查看它是否有效。

这可能更容易在一个更简单的嵌入式系统上进行，其中OS（如果有的话）不会妨碍你。

这通常需要一些关于缓存的“几何”及其它方面的知识。 除了简单的用户访问系统和依赖于实现的事情（例如比通过标准C clock机制提供的更精细的时序）之外，对系统进行一些控制也是有帮助的。

这是一个初步的方法：

编写一个例程，该例程采用指向内存，长度和重复次数的指针，并以连续的顺序重复读取所有内存。
编写一个例程，该例程采用指向内存的指针，长度和重复次数，并以连续的顺序重复写入所有内存。
上述例程可能必须将其指针转换为volatile以防止编译器优化远程访问，否则将无效。
分配大量内存。
调用上述每个例程，获取每次调用之前和之后的当前时间，并使用各种长度调用以查看不同长度的时间。

执行此操作时，通常会看到较小长度的快速速度（每秒读取/写入的字节数），较长的速度较慢。 在超过不同级别的高速缓存的大小的情况下将发生速度降低。 因此，您很可能会看到使用上述技术收集的数据中反映出L1和L2缓存的大小。

以下是一些方法不充分的原因：

它不控制用于读取或写入缓存的指令。 C编译器可以生成加载字和存储字指令，但是许多现代处理器具有可以一次加载和存储16个字节的指令，并且使用这些指令的读取和写入可能比使用四字节字指令更快。
当您按顺序访问时，缓存的行为将与您随机访问时的行为不同。 大多数缓存都会尝试跟踪何时使用数据，以便最近使用的数据保留在缓存中，而其他数据则被淘汰。 实际程序的访问部分通常不同于上述连续操作。
特别是，对存储器的连续写入可能能够填充整个高速缓存行，因此不需要从存储器读取任何内容，而只需将一个字写入特定位置的实际使用模式可能必须通过读取来实现来自内存的缓存行以及更改后的字节中的合并。
来自系统上其他进程的竞争将干扰缓存和测量中的内容。

看一下cachegrind-valgrind ：

Cachegrind模拟程序如何与机器的缓存层次结构和（可选）分支预测器进行交互。 它模拟具有独立的第一级指令和数据缓存（I1和D1）的机器，由统一的二级缓存（L2）支持。 这与许多现代机器的配置完全匹配。

看看他们以某种方式相关的好问题：

编写 C 程序来测量 Linux 操作系统中上下文切换所花费的时间

[英]Write a C program to measure time spent in context switch in Linux OS

如何测量 C/C++ 中的顺序内存读取速度

[英]How to measure sequential memory read speed in C/C++

如何在C程序中测量scanf时间？

[英]How to measure scanf time in a C program?

如何测量短C /汇编代码的速度？

[英]How to measure speed of short piece of C/assembly code?

如何在C中以较低的时钟速度运行程序

[英]How to run a program at a lower clock speed in C

如何在 Visual Studio 中测量 C 程序的函数堆栈大小？

[英]How to measure function stack size for a C program in Visual Studio?

如何测量C程序中每条指令的CPU周期

[英]How to measure CPU cycles per instruction in a C program

如何在Linux下测量C程序的ACTUAL执行时间？

[英]How to measure the ACTUAL execution time of a C program under Linux?

C libcurl - 测量下载速度和剩余时间

[英]C libcurl - measure download speed and time remaining

提高C程序的计算速度

[英]improve the speed of calculation of a C program

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 编写 C 程序来测量 Linux 操作系统中上下文切换所花费的时间如何测量 C/C++ 中的顺序内存读取速度如何在C程序中测量scanf时间？如何测量短C /汇编代码的速度？如何在C中以较低的时钟速度运行程序如何在 Visual Studio 中测量 C 程序的函数堆栈大小？如何测量C程序中每条指令的CPU周期如何在Linux下测量C程序的ACTUAL执行时间？ C libcurl - 测量下载速度和剩余时间提高C程序的计算速度

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM