标签[cachegrind] - 堆栈内存溢出

为什么 wincachegrind 给了我错误的 curl_exec 累积时间？ - Why is wincachegrind giving me the wrong cumulative time for curl_exec?

我正在为这种明显的差异而绞尽脑汁：我的页面加载时间大约为 8 秒。 Wincachegrind 说我的页面只需要 0.8 秒我最终在 kcachegrind 中加载了相同的 cachegrind 文件，并获得了与实际页面加载一致的结果。那么为什么 wincachegrind 会 ...

Cachegrind：为什么这么多缓存未命中？ - Cachegrind: Why so many cache misses?

我目前正在学习Linux下的各种分析和性能实用程序，特别是valgrind / cachegrind。我有以下玩具程序：用g++ -O2 -g main.cpp编译这个程序并运行valgrind --tool=cachegrind ./a.out ，然后cg_annotate ...

如何确定我的程序中的缓慢是否是CPU缓存问题（在Linux上）？ - How can I pinpoint if the slowness in my program is a CPU cache issue (on Linux)?

我目前正试图在我的一个C程序中理解一些非常奇怪的行为。显然，在它结尾处添加或删除看似无关紧要的行会大大影响程序其余部分的性能。我的程序看起来有点像这样：理论上，主函数末尾的fclose(input)行无关紧要，因为OS无论如何都应该在程序结束时自动关闭文件。但是我观察到 ...

Wincachegrind给出了一个错误 - Wincachegrind gives an error

当我尝试使用wincachegrind并获取cachegrind文件时，它返回找不到通话目标。 cachegrind.out行号：68 谁知道怎么解决这个问题？更新，这是错误的屏幕截图：单击此链接 ...

为什么cachegrind不是完全确定的？ - Why isn't cachegrind completely deterministic?

受SQLite的启发，我正在寻找使用valgrind的“cachegrind”工具来进行可重现的性能基准测试。它输出的数字比我发现的任何其他计时方法稳定得多，但它们仍然不具有确定性。举个例子，这是一个简单的C程序：如果我编译它并在cachegrind下运行它，我得到以下结果： ...

在OpenJDK JVM上运行cachegrind - Running cachegrind on OpenJDK JVM

我想使用cachegrind在OpenJDK JVM上进行一些性能分析。（顺便说一句，如果这不是一个好主意，我想知道为什么。）问题在于它会不断触发JVM中的断言。所以我该怎么做才能使用cachegrind运行。否则，请告诉我为什么这行不通。并且，如果您可以建议使用cach ...

在Valgrind中限制Cachegrind的数据收集 - Limiting data collection of Cachegrind, in Valgrind

众所周知， valgrind套件的callgrind分析工具通过命令行指令callgrind_control -i on或callgrind_control -i off提供了启动和停止数据收集的可能性。例如，以下代码将仅在小时后收集数据。 cachegrind工具有类似的选择吗？ ...

我不明白cachegrind与perf工具之间的缓存缺失计数 - I don't understand cache miss count between cachegrind vs. perf tool

我正在研究使用简单的微基准测试缓存效果。我认为如果N大于缓存大小，那么缓存在每个第一个读取缓存行都有一个未命中操作。在我的机器中，缓存行大小= 64Byte，所以我认为完全缓存发生N / 8未命中操作和缓存研磨显示。但是，perf工具显示不同的结果。它只发生34,265次高 ...

如何在c ++中编写指令缓存友好程序？ - How to write instruction cache friendly program in c++?

最近Herb Sutter就“现代C ++：你需要知道什么”发表了精彩演讲。本次演讲的主题是效率以及数据位置和访问内存的重要性。他还解释了内存（数组/向量）的线性访问如何被CPU所喜爱。他从另一个经典参考“Bob Nystrom的游戏表演”中就此主题举了一个例子。阅读这些文章 ...

MySQL会话的调用图 - call graph for MySQL sessions

我正在尝试创建MySQL客户端连接的valgrind （cachegrind）分析。我正在使用--trace-children=yes运行valgrind 。我想找到的是内部方法调用之一，以便在使用时查看调用图... 运行valgrind --trace-children=y ...

QCacheGrind源代码路径错误 - QCacheGrind source code path wrong

试图用QCacheGrind配置我的代码，一切都很好，但我看不到程序中的源代码。由于某种原因，源代码路径是错误的。现在它是cachegrind file location + php file location 它应该只是php file location ...

为什么cachegrind忽略了L3缓存，这与文档相矛盾？ - Why is the L3 cache ignored by cachegrind, contradicting documentation?

我想了解人们如何进行缓存优化，我被朋友建议cachegrind作为实现此目标的有用工具。 Valgrind的是一个CPU模拟器，假定一个2级高速缓存，如所提到这里，使用cachegrind时 Cachegrind模拟程序如何与机器的缓存层次结构和（可选）分支预测器进行交互。 ...

你如何解释cachegrind输出缓存未命中？ - How do you interpret cachegrind output for caching misses?

出于好奇，我运行编码了几个不同版本的矩阵乘法，并对它运行cachegrind。在下面的结果中，我想知道哪些部分是L1，L2，L3未命中和引用以及它们的真正含义是什么？下面是我的矩阵乘法代码，万一有人需要。矩阵乘法码。 ...

同一程序在多次运行之间的不同缓存未命中计数 - Different cache miss count for a same program between multiple runs

我正在使用Cachegrind来检索没有libc编译的静态程序的高速缓存未命中数（只是调用我的主函数的_start和asm中的退出syscall）。该程序是完全确定性的，指令和内存引用不会从一次运行更改为另一次运行。缓存与LRU作为替换策略完全关联。但是，我注意到错过的次数有时会 ...

使用cachegrind和callgrind的不同读写计数 - Different read and write count using cachegrind and callgrind

我正在使用Cachegrind，Callgrind和Gem5做一些实验。我注意到，gem5将许多访问记录为cachegrind的读取，callgrind的写入以及读取和写入。让我们举一个非常简单的例子：我编译： gcc ex.c --static -o ex ...

使用Xdebug配置cachegrind时遇到问题 - Trouble configuring cachegrind with Xdebug

我正在尝试为cachegrind配置Xdebug但我无法启用分析器功能以转储已执行的网页。我正在使用官方指南（还有一些类似的设置），它似乎不起作用。我试过我的两台Linux机器（Ubuntu和Fedora）。 Xdebug工作正常，我可以为应用程序启动valgrind --t ...

Valgrind与Linux性能比较 - Valgrind vs. Linux perf correlation

假设我选择perf事件instructions ， LLC-load-misses ， LLC-store-misses 。进一步假设我测试一个改变其输入的程序prog 。对于相同的输入和相同的计数器， valgrind是否应该为我提供“相同”的功能结果？也就是说，如果perf一个值 ...

缓存友好方法乘以两个矩阵 - Cache friendly method to multiply two matrices

我打算使用缓存友好的方法将2个矩阵相乘（这将导致更少的未命中）我发现这可以通过缓存友好的转置函数来完成。但我无法找到这个算法。我可以知道如何实现这一目标吗？ ...

cachegrind计数不能反映实际性能 - cachegrind counts do not reflect real performance

同一算法的两个版本在valgrind / cachegrind下产生不同的总指令获取计数和周期估计。差异约为25％。但是，处理时间非常相似（对于cachegrind-slow版本，实际上更短）：版本1：版本2：这是预期的行为吗？我如何了解有关版本1为何 ...

缓存未命中的价格是多少 - What is the price of a cache miss

我正在分析一些代码并使用cachegrind来获取执行中的cachemisses（L2和L3）的数量。我的问题是如何根据缓存未命中确定等待缓存获取readdy的时间？我希望能够说出“我的代码获得90％的cpu利用率”之类的话题是否可以根据缓存研磨输出执行此操作？ ...