繁体 English 中英

分析指令高速缓存未命中

[英]Profiling instruction cache misses

原文 2015-06-11 18:25:53 6 1 c++/ caching

我想为我的代码中的每个非内联函数f()构造的指令缓存惩罚的直方图。 因此，如果我的代码中总共有k个非内联函数，则需要k个独立的直方图。 我想知道是否有任何已知的解决方案。

任何一个特定函数f1()的幼稚方法都是在代码中找到对f1()所有调用，在调用之前记录一个时间戳记值，并在f1()的开始记录一个时间戳记，构造一个差异的直方图。 它需要添加（n + 1）行新代码，其中n是f1()的调用次数。

我基本上想要这个天真的解决方案的可扩展版本。

根据您的操作系统和处理器，有更精确的解决方案可用。 如果您使用的是Linux，请使用perf_events 。 它为PMU事件提供了一个很好的接口。 您可以使用它来获取icache丢失的准确计数，并在这些事件上采样堆栈快照，以找出icache丢失的发生位置。

[英]Profiling cache misses of a routine

[英]Reducing Instruction Cache misses (in C++)

[英]Efficient cache and BLOB's - profiling cache hits/misses

[英]Why does my code cause instruction-cache misses?

[英]Recursion, the stack and cache misses

[英]Fewer cache misses with TLS?

[英]Performance of std::pow - cache misses?

[英]stack, cache misses and virtual memory

[英]Cache misses seem work not properly

[英]the instruction cache and conditional statements

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 分析例程的高速缓存未命中减少指令高速缓存未命中（在C ++中）高效的缓存和BLOB - 分析缓存命中/未命中为什么我的代码导致指令缓存未命中？递归，堆栈和缓存未命中使用TLS的缓存未命中次数更少？ std :: pow的性能 - 缓存未命中？堆栈，缓存未命中和虚拟内存缓存未命中似乎工作不正常指令缓存和条件语句

相关标签