计算机组成与设计：硬件软件接口

Ubec

2024-06-21

计组

第 4 章处理器

一台计算机的性能由三个关键因素决定：

定义：在下一个时钟周期中下一跳指令不能执行

结构冒险：硬件不支持多条指令在同一时钟周期执行。比如第一条指令在访问存储器，第四条指令在预取指令，就会结构冒险

数据冒险：一条指令必须等待另一条执行的完成而造成流水线暂停。有数据依赖时会产生

前推：也称为旁路。是一种解决数据冒险的做法，具体做法是从内部寄存器而非程序员课件的寄存器或存储器中提前取出数据

控制冒险（分支冒险）：决策依赖于一条指令的结果，而其他指令正在执行中；因为指令地址的变化并不是流水线所预期的，而导致指令不能在预定的时钟周期内执行

假设有以下指令序列：

1 2	ADD R1, R2, R3 # R1 = R2 + R3 SUB R4, R1, R5 # R4 = R1 - R5

在没有旁路的情况下，第二条指令（SUB）需要等到第一条指令（ADD）完成写回阶段（WB）后，才能读取 R1 的值。这意味着第二条指令会被暂停，直到第一条指令完成。

有了旁路技术，处理器可以在第一条指令的执行阶段（EX）完成后，立即将 R1 的值转发给第二条指令的执行阶段（EX），而不需要等待写回阶段（WB）完成。

遇到分支指令时，比如 if 语句或循环，处理器需要知道分支的结果才能确定下一条指令的执行路径。如果处理器在等待分支指令的结果期间停止或延迟其他指令的执行，整个流水线的效率就会大大降低。

乱序发射（Out-of-Order Execution）是一种高级处理器优化技术，通过允许指令不按程序的顺序执行，来提高指令的执行效率和处理器的整体性能。这种技术通过动态地重新排列指令的执行顺序，有效地利用处理器中的可用资源，减少因数据依赖和资源冲突导致的流水线停顿。

指令取指（Instruction Fetch）：处理器按照程序的顺序从内存或指令缓存中取指。
指令解码（Instruction Decode）：将取出的指令解码，识别操作码、操作数和目标寄存器。
指令调度（Instruction Scheduling）：在乱序执行的处理器中，这一步骤至关重要。处理器将解码后的指令放入一个称为“指令窗口（Instruction Window）”或“缓冲区（Buffer）”的结构中。指令调度器会分析这些指令之间的依赖关系，并寻找可以无冲突执行的指令。
指令发射（Instruction Issue）：处理器根据可用的执行单元和指令的准备情况，选择可以立即执行的指令发射到执行单元中。这些指令可能不是按照程序顺序，而是按照资源可用性和依赖性来决定的顺序。
指令执行（Instruction Execution）：各执行单元并行且独立地执行指令。由于乱序发射，处理器可以在等待某些指令的操作数准备就绪时，继续执行其他不依赖这些操作数的指令。
结果提交（Commit/Retire）：为了保证程序的最终结果与顺序执行一致，处理器使用一个重排序缓冲区（Reorder Buffer, ROB）来按程序顺序提交指令的执行结果。只有当一个指令的所有前驱指令都提交之后，它的结果才会正式写回寄存器或内存。