繁体 English 中英

如果有的话，intel 和 amd 的 ISA 之间究竟有什么区别？

[英]What EXACTLY is the difference between intel's and amd's ISA, if any?

原文 2016-07-22 01:27:55 2 1 x86-64/ intel/ amd-processor/ instruction-set

我知道以前有人问过类似的问题，但是有太多相互矛盾的信息，我真的想尝试一劳永逸地解决它。 我将通过明确区分指令集架构 (ISA) 和实际硬件实现来尝试这样做。 首先我试图澄清：

1.) 目前有 intel64 和 amd64 CPU（其中包括但这些是重点）

2.) 鉴于 ISA 是 1 个或多个 CPU 指令的二进制表示，这意味着 ISA 与其实际的硬件实现完全分开。

我的问题：

intel 64 和 amd64 CPU 之间的差异是否与不同或扩展的 x86-64 ISA 有关？ 或者 x86-64 ISA 的不同硬件实现？ 还是两者兼而有之？

1 个解决方案

是的，ISA 是一个文档/规范，而不是硬件。 正确实现所有这些是使某些东西成为 x86 CPU 的原因，而不仅仅是与 x86 相似的东西。

有关官方文档（英特尔手册）的链接，请参阅x86标签 wiki。

Intel 和 AMD 的x86 ISA 实现的不同主要在于性能以及它们支持的指令集扩展。 软件可以使用CPUID指令查询支持的内容。

也存在非性能差异，例如指令语义的偶尔细微差异，尤其是操作系统需要使用的特权指令：

这里的主要分歧之一是英特尔、AMD 和威盛都有自己的硬件虚拟化扩展，它们甚至不尝试兼容。 因此，像 Xen 这样的 VM 需要为这些扩展中的每一个单独的“驱动程序”或“后端”代码。 但这些仍然是扩展，不是基线 x86 的一部分。

供用户空间程序使用的 SIMD 扩展最终在两者上都可用，通常会延迟，这要归功于英特尔通过反竞争做法来颠覆 AMD 的努力。 这会花费其他人的时间，并且通常不利于整个 x86 生态系统（例如，SSSE3 现在可以被假定为更多软件的基准），但有助于英特尔的底线。 一个很好的例子：AMD Bulldozer 支持 FMA4，但英特尔在最后一刻改变了主意，在 Haswell 中实现了 FMA3。 AMD 直到他们的下一个微架构（Piledriver）才支持这一点。

鉴于 ISA 是 1 个或多个 CPU 指令的二进制表示。

不，ISA 远不止于此。 Intel 记录为在所有 x86 CPU 上得到保证的所有内容都是 ISA 的一部分。 这不仅仅是每条指令的详细行为，还包括哪个控制寄存器做什么以及内存排序规则之类的东西。 基本上，英特尔和 AMD 出版的手册中的所有内容都没有以“关于某某特定型号的 CPU”开头。

我预计在某些情况下，Intel 和 AMD 的系统编程指南在 x86 的工作方式上有所不同。 （如果他们为他们的 x86 CPU 发布他们自己的 VIA 的话）。 我没有检查过，但我很确定用户空间不会受此影响：如果存在差异，它们仅限于特权指令，只有在内核运行它们时才有效。 无论如何，在那种情况下，我想您可以说 x86 ISA 是 Intel 和 AMD 文档的通用子集。

请注意，尝试找出实际硬件在实践中的作用对于理解文档很有用，但不能替代阅读它们。 您不希望您的代码依赖于一条指令在您测试的 CPU 上的行为方式。

然而，英特尔确实使用真实软件测试了他们的新设计，因为无法运行现有版本的 Windows 将是商业上的一个缺点。 例如， Windows9x 不会使只能凭推测填充的 TLB 条目无效（本示例的其余部分只是对那篇非常详细的博客文章的总结和推断）。 这要么是基于它是安全的（并且当时在硬件上是安全的）假设的性能黑客，要么是一个未被注意到的错误。 当时无法通过硬件测试检测到它。

现代英特尔 CPU 会进行推测性页面遍历，但即使在最近 Haswell 检测和击落错误推测时，假设这种情况不会发生的代码仍然可以工作。

这意味着真正的硬件提供了比 ISA 更强的排序保证，它说：

处理器可以缓存预取和作为推测执行结果的访问所需的转换，这些预测执行在执行的代码路径中永远不会实际发生。

尽管如此，依赖这种更强的行为将是一个错误，除非您只在已知的微体系结构上这样做。 AMD K8/K10 类似于 Intel，但推土机系列推测没有任何检测+回滚机制来提供一致性，因此 Win9x 内核代码在该硬件上是不安全的。 未来的英特尔硬件也可能会放弃检测+回滚机制。

TL:DR：所有 uarches 都实现了 x86 ISA 所说的内容，但有些提供了更强的保证。 如果您和 Microsoft 一样大，Intel 和 AMD 将设计 CPU 来重现您的代码所依赖的非 ISA 保证行为。 至少在该软件长期过时之前。 无法真正保证未来的英特尔 uarch 将保留回滚机制。 如果英特尔从头开始进行另一次重新设计（比如 P4 / NetBurst，而不是仅仅建立在他们现有的 Sandybridge uarch 系列上），那么他们可能会改变一些东西。

一个不同的例子：根据英特尔 insn ref 手册中的论文规范，输入为零的bsf指令使其输出未定义。

但是对于任何特定的 CPU，都会有一些行为模式，例如将输出设置为零，或保持不变。 在纸面上，由于不同的微体系结构状态，乱序执行 CPU 真正给出对于相同输入不同的不可预测的结果是有效的。

但是英特尔选择在芯片中实现的行为是在bsf或bsr输入为零时始终保持目的地不变。 AMD 也这样做，甚至记录了行为。 它基本上是mov eax,32 / bsf eax, ebx将完全像tzcnt一样工作的非官方保证（标志设置除外，例如基于输入为 0 而不是输出的 ZF）。

这就是popcnt / lzcnt / tzcnt对 Intel CPU 中的输出寄存器有错误依赖的原因！ .

CPU 供应商通常会超越纸质 ISA 规范，以避免破坏某些依赖于这种行为的现有代码（例如，如果该代码是 Windows 的一部分，或者英特尔 / AMD 在其新 CPU 上测试的其他主要软件部分）设计）。

正如 Andy Glew 在有关上述连贯页面遍历以及自修改代码的评论线程中所说的那样：

一个特定的实现必须实现与架构声明兼容但比架构声明更强的规则，这是很常见的。 但并非所有实现都必须以相同的方式执行此操作。

在Intel 64 ISA中进行类型转换的说明是什么

[英]What's the instructions for type casting in Intel 64 ISA

英特尔和AMD x86-64实现的兼容子集是什么？

[英]What is the compatible subset of Intel's and AMD's x86-64 implementations?

AMD 架构上是否有与 Intel 的 MSR_SMI_COUNT 等效的寄存器？

[英]Is there an equivalent register to Intel's MSR_SMI_COUNT on AMD architecture?

amd64 和 Intel x86-64 栈帧的区别

[英]Difference between amd64 and Intel x86-64 stack frame

Intel 的 SDM 手册中的“根据结果设置”是什么意思？

[英]What does “set according to the result” mean in Intel's SDM manuals?

Intel Optane Persistent Memory 上的 clwb 和 ntstore 的延迟是多少？

[英]What is the latency of `clwb` and `ntstore` on Intel's Optane Persistent Memory?

x86-64 AT&T 指令 movq 和 movabsq 有什么区别？

[英]What's the difference between the x86-64 AT&T instructions movq and movabsq?

Linux ldd 中的“静态链接”和“非动态可执行文件”有什么区别？

[英]What's the difference between “statically linked” and “not a dynamic executable” from Linux ldd?

英特尔的AMD APP OpenCL SDK

[英]AMD APP OpenCL SDK on Intel

使用英特尔编译器的Windows和Linux之间的性能差异：查看程序集

[英]Performance difference between Windows and Linux using Intel compiler: looking at the assembly

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 在Intel 64 ISA中进行类型转换的说明是什么英特尔和AMD x86-64实现的兼容子集是什么？ AMD 架构上是否有与 Intel 的 MSR_SMI_COUNT 等效的寄存器？ amd64 和 Intel x86-64 栈帧的区别 Intel 的 SDM 手册中的“根据结果设置”是什么意思？ Intel Optane Persistent Memory 上的 clwb 和 ntstore 的延迟是多少？ x86-64 AT&T 指令 movq 和 movabsq 有什么区别？ Linux ldd 中的“静态链接”和“非动态可执行文件”有什么区别？英特尔的AMD APP OpenCL SDK 使用英特尔编译器的Windows和Linux之间的性能差异：查看程序集

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM