
[英]What is better from an energy-saving perspective to run task minimum energy consumption
CPU频率和CPU使用率是影响能耗的主要因素(据我所知)。 然而,从节能的角度来看,运行任务的最低能耗更好: 选项 1:使用最少的最大 CPU 频率选项 2:最小频率下的最大 CPU 使用率。 ...
[英]What is better from an energy-saving perspective to run task minimum energy consumption
CPU频率和CPU使用率是影响能耗的主要因素(据我所知)。 然而,从节能的角度来看,运行任务的最低能耗更好: 选项 1:使用最少的最大 CPU 频率选项 2:最小频率下的最大 CPU 使用率。 ...
[英]Why are the x86 bit-string manipulation instructions slow with a memory destination? (BTS, BTR, BTC)
Agner发现,在大多数支持它们的处理器上,应用于 memory 操作数的 x86 位操作指令(btr bts btc,无锁)比其他读-修改-写指令(如 add、xor 等)慢。 为什么是这样? 这些说明似乎很容易实现。 是否因为实际加载的地址与 memory 操作数指定的地址不同,这混淆了一些 ...
[英]Is there a way to check if a manifest in a Docker registry is multi-arch or not?
当您从 Docker 注册表中提取多体系结构清单时,它会自动选择与您的计算机体系结构相匹配的单个图像并提取该图像(如果可能); 从客户端来看,这似乎与拉取单架构图像清单相同。 有没有办法从客户端确定清单是单架构还是多架构,例如通过查询 API 端点? ...
[英]Is cache miss rate the only thing that matters when deciding which is better or performs better?
如果我有两种不同的缓存子系统设计 C1 和 C2,它们的硬件复杂度大致相同,考虑到缓存子系统的有效性是首要因素,我是否可以决定哪一个是更好的选择,即应该尽量减少未命中数。 给出下面的总未命中率: miss_rate = (number of cache misses)/(number of cac ...
[英]What is an instruction profile?
这是我教科书中的陈述,它让我对“指令概要”的含义感到困惑: “......新的外围设备在典型指令配置文件和数据访问模式方面不断改变系统需求的性质。” - 计算机组织和体系结构:性能设计第 10 版在搜索指令配置文件的定义时,我找不到。 我找到了用于教学/教学法的教学概况的结果,一个 pdf 显示 ...
[英]How do *move elimination* slots work in Intel CPU?
Andreas Abel 和 Jan Reineke 在他们描述 uiCA 的论文中讨论了移动消除: 4.1.4移动消除。 [...] 然而,这一举动消除并不总是成功的。 [...] 我们开发了微基准测试,使用这些计数器来分析移动消除何时成功。 [...] 以下 model 同意我们的观 ...
[英]Why cannot my program reach integer addition instruction throughput bound?
我已阅读 CSAPP 3e 的第 5 章。 我想测试一下书中描述的优化技术是否可以在我的电脑上运行。 我写了下面的程序: 它报告 CPE 约为 1.00。 我使用 4x4 循环展开技术转换程序,它导致以下程序: 请注意,当SIZE不是 4 的倍数时,我省略了处理这种情况的代码。该程序报告 CPE ...
[英]Is port blocked when data is fetching from cache or memory in CPU microarchitecture?
Intel Skylake 内核有两个相同的 memory 读端口(端口 2 和 3)和一个写端口(端口 4)。 假设有两条加载指令并行发给端口2和端口3: 当两个数据都可以从 L1 缓存中获取时(大约 ~10ns),端口 2 和 3 是否会被阻塞,直到数据被获取并且加载指令退出? 如果数据在缓 ...
[英]How do I solve this logic error in my circuit using 2:1 mux
如果R,H和C都为0,(Y = 1) 如果R为1且H,C为0,(Y = 1) 如果 R 和 H 为 1 且 C 为 0,(Y = 1) 如果 R 和 H 为 0 且 C 为 1,则 (Y = 1) 如果 R 为 0 且 H 和 C 为 1,(Y = 0) 如果 R 和 C 为 0 且 H 为 1,则 ...
[英]How many blocks in this cache?
使用练习 5.2 中的引用序列,显示具有两个字块且总大小为 24 个字的三路组关联高速缓存的最终高速缓存内容。 问题来了,这个缓存中有多少“块”。 我认为一个块有2个词,所以应该有12个块,在三路中,一个路包含4个块。 但是解决方案说每条路有 24/3=8 个块。 我错了吗? 或者解决方案不正确? ...
[英]How is a critical path formed when there is a data dependency between a loop iterations while a CPU executing instructions?
在Computer Systems From A Programmer's Perspective一书中,有以下循环汇编代码: 用于建模问题的抽象CPU有以下功能单元: 手术潜伏问题容量 + 1个 1个 4个加载 4个 1个 2个假设%rsi和%rdi指向不同的 memory 位置,作者说关键路 ...
[英]Does the processor copy the same bloc from RAM to all caches?
缓存未命中时,处理器访问 RAM 以读取数据并执行预取操作,数据从 RAM 流向 L3 缓存,然后是 L2,最后是 L1。 在预取期间,处理器是否在所有缓存级别中复制相同的块? ...
[英]Why is 8086 control bus 4 bits?
我想知道为什么8086控制总线由4条I/O读/写和Mem读/写组成。 这些显然是 4 种不同的功能,仅使用 2 行即可确定。 在这个geeksforgeeks 链接中我们可以清楚的看到RD是WR的not操作 ...
[英]What is non-microsequenced instruction?
在英特尔优化手册第 3 章第 3.5.1 节中,它说如果您需要使用多个微操作、非微序列指令,请尝试通过几个单微操作指令分开。 以下指令是不需要微序列器的多微操作指令的示例: ADC/SBB CMOVCC 读-修改-写指令由于“Micro Instructions Sequencer is a ...
[英]Description of x86-64 illegal two byte opcodes
最近写了一个 C 程序来查找 x86-64 的两字节非法操作码,并将 output 粘贴到https://pastebin.com/5xjjFea6 例如,这里有一些非法的两字节操作码 从谷歌上,我只找到了一些描述 问题是否有解释大多数非法操作码的文档? 为什么存在非法操作码? 为什么不将它们视为 ...
[英]Computer architecture and compiler
基于我对以下假设的理解,我有一个疑问,1.对于每个 CPU 体系结构,汇编语言集都会有所不同。 所以,我怀疑通用编译器/解释器如何将其转换为 .asm 代码,因为并非所有计算机都具有相同的体系结构! 对此的回答我猜想“当我们在我们的系统本身中安装编译器时,它会了解它正在安装的计算机体系结构,因此它将 ...
[英]Why unlamination of μops necessary?
在 “英特尔 CPU 中的 MicroFusion”中。 丹尼斯·巴赫瓦洛夫 (Denis Bakhvalov ) 说: SandyBridge 的 Unlamination 在英特尔® 64 和 IA-32 架构优化参考手册的“2.3.2.4:微操作队列和循环 Stream 检测器 (LS ...
[英]how to understand the result of xxd -d dumper?
我研究了从物理学到逻辑门再到处理器的许多学科。 我也学过计算机体系结构,编译器,汇编x86,操作系统,GPU,.... 由于某些原因,上面提到的所有主题都没有涵盖“在编译器生成可执行文件之后”向下处理器进行的操作。 请你能给我提供资源来解释这些事情吗? 因为如果我不明白事情为什么会这样运作,我的思 ...
[英]Placing NOPs in order to ensure no RAW Data hazard in MIPS assembly
目前致力于理解 MIPS 体系结构和汇编语言,有人要求我在以下汇编代码中放置 NOP: 我已经根据我被教导的方式放置了 NOP,并得到了这个: 这对我来说感觉很糟糕,我相信有一种方法可以减少 NOP,并且仍然可以处理这段代码中的所有 RAW 数据危害。 编辑: 在看到第 2 行和第 3 行没有依赖关 ...
[英]Core physical registers usage for XMM registers
在 X86 中,CPU 使用什么类型的物理内部寄存器用于 XMM 类型的寄存器。 那是整数还是向量物理寄存器? 我认为使用矢量寄存器是因为 XMM 寄存器是 128 位寄存器。 任何确认表示赞赏。 ...