cost 414 ms
从节能的角度来看,运行任务能耗最低的是什么更好

[英]What is better from an energy-saving perspective to run task minimum energy consumption

CPU频率和CPU使用率是影响能耗的主要因素(据我所知)。 然而,从节能的角度来看,运行任务的最低能耗更好: 选项 1:使用最少的最大 CPU 频率选项 2:最小频率下的最大 CPU 使用率。 ...

为什么 x86 位串操作指令对于 memory 目标很慢? (防弹少年团、比特瑞、比特币)

[英]Why are the x86 bit-string manipulation instructions slow with a memory destination? (BTS, BTR, BTC)

Agner发现,在大多数支持它们的处理器上,应用于 memory 操作数的 x86 位操作指令(btr bts btc,无锁)比其他读-修改-写指令(如 add、xor 等)慢。 为什么是这样? 这些说明似乎很容易实现。 是否因为实际加载的地址与 memory 操作数指定的地址不同,这混淆了一些 ...

有没有办法检查 Docker 注册表中的清单是否是多架构的?

[英]Is there a way to check if a manifest in a Docker registry is multi-arch or not?

当您从 Docker 注册表中提取多体系结构清单时,它会自动选择与您的计算机体系结构相匹配的单个图像并提取该图像(如果可能); 从客户端来看,这似乎与拉取单架构图像清单相同。 有没有办法从客户端确定清单是单架构还是多架构,例如通过查询 API 端点? ...

在决定哪个更好或性能更好时,缓存未命中率是唯一重要的因素吗?

[英]Is cache miss rate the only thing that matters when deciding which is better or performs better?

如果我有两种不同的缓存子系统设计 C1 和 C2,它们的硬件复杂度大致相同,考虑到缓存子系统的有效性是首要因素,我是否可以决定哪一个是更好的选择,即应该尽量减少未命中数。 给出下面的总未命中率: miss_rate = (number of cache misses)/(number of cac ...

什么是指令配置文件?

[英]What is an instruction profile?

这是我教科书中的陈述,它让我对“指令概要”的含义感到困惑: “......新的外围设备在典型指令配置文件和数据访问模式方面不断改变系统需求的性质。” - 计算机组织和体系结构:性能设计第 10 版在搜索指令配置文件的定义时,我找不到。 我找到了用于教学/教学法的教学概况的结果,一个 pdf 显示 ...

*移动消除*插槽如何在英特尔 CPU 中工作?

[英]How do *move elimination* slots work in Intel CPU?

Andreas Abel 和 Jan Reineke 在他们描述 uiCA 的论文中讨论了移动消除: 4.1.4移动消除。 [...] 然而,这一举动消除并不总是成功的。 [...] 我们开发了微基准测试,使用这些计数器来分析移动消除何时成功。 [...] 以下 model 同意我们的观 ...

为什么我的程序不能达到 integer 加法指令吞吐量界限?

[英]Why cannot my program reach integer addition instruction throughput bound?

我已阅读 CSAPP 3e 的第 5 章。 我想测试一下书中描述的优化技术是否可以在我的电脑上运行。 我写了下面的程序: 它报告 CPE 约为 1.00。 我使用 4x4 循环展开技术转换程序,它导致以下程序: 请注意,当SIZE不是 4 的倍数时,我省略了处理这种情况的代码。该程序报告 CPE ...

从缓存或 memory 在 CPU 微架构中获取数据时端口是否被阻塞?

[英]Is port blocked when data is fetching from cache or memory in CPU microarchitecture?

Intel Skylake 内核有两个相同的 memory 读端口(端口 2 和 3)和一个写端口(端口 4)。 假设有两条加载指令并行发给端口2和端口3: 当两个数据都可以从 L1 缓存中获取时(大约 ~10ns),端口 2 和 3 是否会被阻塞,直到数据被获取并且加载指令退出? 如果数据在缓 ...

这个缓存中有多少块?

[英]How many blocks in this cache?

使用练习 5.2 中的引用序列,显示具有两个字块且总大小为 24 个字的三路组关联高速缓存的最终高速缓存内容。 问题来了,这个缓存中有多少“块”。 我认为一个块有2个词,所以应该有12个块,在三路中,一个路包含4个块。 但是解决方案说每条路有 24/3=8 个块。 我错了吗? 或者解决方案不正确? ...

当 CPU 执行指令时循环迭代之间存在数据依赖性时,如何形成关键路径?

[英]How is a critical path formed when there is a data dependency between a loop iterations while a CPU executing instructions?

在Computer Systems From A Programmer's Perspective一书中,有以下循环汇编代码: 用于建模问题的抽象CPU有以下功能单元: 手术潜伏问题容量 + 1个 1个 4个加载 4个 1个 2个假设%rsi和%rdi指向不同的 memory 位置,作者说关键路 ...

什么是非微序列指令?

[英]What is non-microsequenced instruction?

在英特尔优化手册第 3 章第 3.5.1 节中,它说如果您需要使用多个微操作、非微序列指令,请尝试通过几个单微操作指令分开。 以下指令是不需要微序列器的多微操作指令的示例: ADC/SBB CMOVCC 读-修改-写指令由于“Micro Instructions Sequencer is a ...

x86-64非法两字节操作码说明

[英]Description of x86-64 illegal two byte opcodes

最近写了一个 C 程序来查找 x86-64 的两字节非法操作码,并将 output 粘贴到https://pastebin.com/5xjjFea6 例如,这里有一些非法的两字节操作码 从谷歌上,我只找到了一些描述 问题是否有解释大多数非法操作码的文档? 为什么存在非法操作码? 为什么不将它们视为 ...

计算机体系结构和编译器

[英]Computer architecture and compiler

基于我对以下假设的理解,我有一个疑问,1.对于每个 CPU 体系结构,汇编语言集都会有所不同。 所以,我怀疑通用编译器/解释器如何将其转换为 .asm 代码,因为并非所有计算机都具有相同的体系结构! 对此的回答我猜想“当我们在我们的系统本身中安装编译器时,它会了解它正在安装的计算机体系结构,因此它将 ...

为什么需要剥离 μops?

[英]Why unlamination of μops necessary?

在 “英特尔 CPU 中的 MicroFusion”中。 丹尼斯·巴赫瓦洛夫 (Denis Bakhvalov ) 说: SandyBridge 的 Unlamination 在英特尔® 64 和 IA-32 架构优化参考手册的“2.3.2.4:微操作队列和循环 Stream 检测器 (LS ...

如何理解 xxd -d dumper 的结果?

[英]how to understand the result of xxd -d dumper?

我研究了从物理学到逻辑门再到处理器的许多学科。 我也学过计算机体系结构,编译器,汇编x86,操作系统,GPU,.... 由于某些原因,上面提到的所有主题都没有涵盖“在编译器生成可执行文件之后”向下处理器进行的操作。 请你能给我提供资源来解释这些事情吗? 因为如果我不明白事情为什么会这样运作,我的思 ...

放置 NOP 以确保 MIPS 汇编中没有 RAW 数据危害

[英]Placing NOPs in order to ensure no RAW Data hazard in MIPS assembly

目前致力于理解 MIPS 体系结构和汇编语言,有人要求我在以下汇编代码中放置 NOP: 我已经根据我被教导的方式放置了 NOP,并得到了这个: 这对我来说感觉很糟糕,我相信有一种方法可以减少 NOP,并且仍然可以处理这段代码中的所有 RAW 数据危害。 编辑: 在看到第 2 行和第 3 行没有依赖关 ...

XMM 寄存器的核心物理寄存器用法

[英]Core physical registers usage for XMM registers

在 X86 中,CPU 使用什么类型的物理内部寄存器用于 XMM 类型的寄存器。 那是整数还是向量物理寄存器? 我认为使用矢量寄存器是因为 XMM 寄存器是 128 位寄存器。 任何确认表示赞赏。 ...


 
粤ICP备18138465号  © 2020-2023 STACKOOM.COM