
[英]Is there a tool to examine the difference of two callgrind/valgrind profiles?
[英]Is valgrind's cachegrind still the go-to tool in 2021?
我是cachegrind程序分析的长期用户,最近又回去查看官方文档: https ://valgrind.org/docs/manual/cg-manual.html
其中,多处引用了 CPU 模型、实现决策和仿真模型,这些模型都来自 2000 年代中期,并且也有声明指出“现代”处理器上的某些行为发生了变化:
LL 缓存通常复制 L1 缓存的所有条目 [...] 这是 Pentium 芯片的标准配置,但 AMD Opterons、Athlons 和 Durons 使用独占的 LL 缓存 [...]
Cachegrind 模拟了 2004 年左右主流桌面/服务器处理器的典型分支预测器。
较新的处理器具有更好的分支预测器 [...] Cachegrind 的预测器设计是故意保守的,以便代表在更复杂的间接分支预测器广泛部署之前的大型处理器安装基础。 特别是,后期模型 Pentium 4s (Prescott)、Pentium M、Core 和 Core 2 具有比 Cachegrind 建模的更复杂的间接分支预测器。
现在我想知道
任何见解都非常感谢!
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.