当前位置：首页 > 北京科技大学计算机体系结构总复习汇总（无重复带计算）

北京科技大学计算机体系结构总复习汇总（无重复带计算）

62 次阅读
3 次下载
2025/12/15 21:07:37

2）从目标处调度：分支转移成功时，可以提高流水线性能，但由于复制指令，可能加大程序空间。

3）从失败处调度：分支转移失败时，可以提高流水线性能。但如果分支转移成功，必须保证被调度的指令对程序的执行没有影响。

12、表示寻址方式的主要方法有哪些？简述它们的优缺点。

1）将寻址方式编于操作码中，由操作码在描述指令的同时也描述了相应的寻址方式。这种方式译码快，但操作码和寻址方式的结合不仅增加了指令的条数，导致了指令的多样性，而且增加了CPU对指令译码的难度。

2）为每个操作数设臵一个地址描述符，由该地址描述符表示相应操作数的寻址方式。这种方式译码较慢，但操作码和寻址独立，易于指令扩展。 13、简述“Cache－主存”层次与“主存－辅存”层次的区别。目的存储管理的实现访问速度的比值（1级：2级）典型的块（页）大小 CPU对第二级访问方式不命中的CPU是否切换 Cache-主存层次为了弥补主存速度的不足全部由专用硬件实现几比一几十个字节可直接访问不切换主存-辅存层次为了弥补主存容量的不足主要由软件实现几万比一几百到几千个字节均通过第一级切换到其它进程 14、试从3C失效的关系分析增加块大小对Cache性能的影响。

降低失效率最简单的方法是增加块大小。（1）对于给定的 Cache 容量，当块大小增加（从16字节开始）时，失效率开始是下降，后来反而上升了。 (2) Cache 容量越大，使失效率达到最低的块大小就越大。导致上述失效率先下降后上升的原因，在于增加块大小会产生双重作用。一方面它减少了强制性失效，因为局部性原理有两方面的含义：时间局部性和空间局部性，增加块大小利用了空间局部性；另一方面，由于增加块大小会减少 Cache 中块的数目，所以有可能会增加冲突失效。在 Cache 容量较小时，甚至还会增加容量失效。刚开始增加块大小时，由于块大小还不是很大，上述的第一种作用超过第二种作用，从而使失效率下降。但等到块大小较大时，第二种作用超过第一种作用，使失效率上升。 0简述减小Cache失效开销的几种方法答：让读失效优先于写、写缓冲合并、请求字处理技术、非阻塞Cache或非锁定Cache技术、采用二级Cache。 15、写出三级Cache的平均访问时间的公式。平均访存时间＝命中时间＋失效率 × 失效开销只有第I层失效时才会访问第I＋1。

设三级Cache的命中率分别为HL1、Hl2、HL3，失效率分别为Ml1、Ml2、ML3，第三级Cache的失效开销为PL3.

则平均访问时间TA ＝HL1＋Ml1{Hl2＋Ml2(HL3＋ML3×PL3)}

16、有哪几种向量处理方式？它们对向量处理机的结构要求有何不同？ 1) 水平处理方式：不适合对向量进行流水处理。

2) 垂直处理方式：适合对向量进行流水处理，向量运算指令的源/目向量都放在存储器内，

使得流水线运算部件的输入、输出端直接与存储器相联，构成MM型的运算流水线。 3) 分组处理方式：适合流水处理。可设长度为n的向量寄存器，使每组向量运算的源/目向量都在向量寄存器中，流水线的运算部件输入、输出端与向量寄存器相联，构成RR型运算流水线。

17、在进行计算机系统设计时，一个设计者应该考虑哪些因素对设计的影响？技术的发展趋势；计算机使用的发展趋势；计算机价格的发展趋势。

18、流水线数据相关有哪几种？解释它们的含义，并用代码举例说明。解决数据相关有哪些主要方法？

首先，流水线有三种相关：名相关，数据相关和控制相关。而数据相关分为：RAW读后写、WAR写后读和WAW写后写相关。

1）其中WAR相关是由于流水线数据相关引起的，即j 的执行要用到 i 的计算结果，当它们在流水线中重叠执行时，j 可能在 i 写入其计算结果之前就先行对保存该结果的寄存器进行读操作，从而得到错误的值。

2）WAW相关是由于名相关的输出相关引起的，即j和i的目的寄存器相同，当它们在流水线中重叠执行时，j可能在i写入其计算结果之前就先行对该结果寄存器进行写操作，从而导致写入顺序错误，在目的寄存器中留下的是 i 写入的值，而不是 j 写入的值。 3）RAW相关是由于名相关的反相关引起的，即j可能在i读取某个源寄存器的内容之前就先对该寄存器进行写操作，导致 i 后来读取到的值是错误的。

如下列代码：F0，F4和R1都存在数据相关，执行将出现错误。但为了保证下述指令序列的正确执行，流水线只好暂停。 Loop： L.D F0，0（R1） ADD.D F4，F0，F2

// F0为数组元素 // 加上F2中的值

S.D F4，0（R1） // 保存结果

DADDIU R1，R1，－8 // 数组指针递减8个字节 BNE R1，R2，Loop // 如果R1≠R2，则分支

采用定向技术可以消除相关，思想是：在某条指令产生计算结果之前，其他指令并不真正立即需要该计算结果，如果能够将该计算结果从其产生的地方直接送到其他指令需要它的地方，那么就可以避免停顿。

19、试举例说明DLX流水线中存在不能依靠定向技术解决的数据相关及其解决方法。不是所有数据相关带来的暂停都可以通过定向技术消除，如下面的例子： LW R1,0(R2) SUB R4,R1,R5 AND R6,R1,R7 OR R8,R1,R9

这是LW指令不能将结果定向到SUB指令，就需要设臵一个称为流水线互锁的功能部件。一旦流水线互锁检测到上述数据相关，流水线暂停执行LW指令之后的所有指令，直到能够通过定向解决该数据相关为止。

四、计算题

1、给定以下的假设，试计算直接映象Cache和两路组相联Cache的平均访问时间以及CPU的性能。由计算结果能得出什么结论？(考试的时候数肯定不一样！！！)

（1）理想Cache情况下的CPI为2.0，时钟周期为2 ns，平均每条指令访存1.3次。（2）两者Cache容量均为64 KB，块大小都是32字节。

（3）组相联Cache中的多路选择器使CPU的时钟周期增加了10%。（4）这两种Cache的失效开销都是70 ns。（5）命中时间为1个时钟周期。

（6）64 KB直接映象Cache的失效率为1.4%，64 KB两路组相联Cache的失效率为1.0%。平均访存时间为：平均访存时间＝命中时间＋失效率×失效开销平均访存时间1路＝2.0＋（0.014×70）＝2.98 ns 平均访存时间2路＝2.0×1.10＋（0.010×70）＝2.90 ns 2路组相联Cache的平均访存时间比较低。

CPU 时间＝IC×(CPIexe＋每条指令的平均存储器停顿周期数)×时钟周期时间

= IC ×(CPIexe×时钟周期时间＋每条指令的平均存储器停顿时间)

CPU时间1路＝ IC×(2.0×2＋(1.3×0.014×70)) ＝ 5.27×IC CPU时间2路＝ IC×(2.0×2×1.10＋(1.3×0.010×70)) ＝ 5.31×IC

所以直接映象Cache的平均性能好一些。

2、计算机系统字长64位，包含三个选择通道和一个多路通道，每个选择通道上连接了两台磁盘机和三台磁带机，多路通道上连接了了两台行式打印机，两台读卡机、10台终端，假定各设备的传输率如下：磁盘机：600 KBps，磁带机：200 KBps，行打机：6.6 KBps，读卡机：1.2 KBps，终端：1 KBps。计算该计算机系统的最大I/O数据传输率。 pn1fMAX-BLOCK??TTS(S?TD)pn?TDkk多路通道最大数据传输率： fMAX-SELECT?pn(TS?TD)pnn?1TS?TDn 选择通道最大数据传输率：传送数据所需要的时间。 TD：传送一个字节所用的时间。

TS：设备选择时间。从通道响应设备发出的数据传送请求开始，到通道实际为这台设备

p：在一个通道上连接的设备台数，且这些设备同时都在工作。 n：每台设备传送的字节数，这里假设每台设备传送的字节数都相同。

k：数组多路通道传输的一个数据块中包含的字节数。在一般情况下，k

磁带等磁表面存储器，通常k=512。

选择通道和数组多路通道的实际流量就是连接在这个通道上的所有设备中数据流量最大的那一个。

因此，多路通道最大传输率是6.6 KBps，选择通道最大传输率是600KBps，系统的最大I/O传输率应为二者之和606.6KBps

3、某计算机系统采用浮点运算部件后使浮点运算速度提高到原来的20倍，而系统运行一程序的整体性能提高到原来的10倍，试计算该程序中浮点操作所占的比例。设比例为x，根据Amdahl定律知：

求解得x=0.0956，即占比9.56%

4、动态多功能流水线由6个功能段组成，如下图所示：

s1s2s3s4s5s6

其中，s1、s4、s5、s6组成乘法流水线，s1、s2、s3、s6组成加法流水线，各个功能段时间为△t，假设该流水线的输出结果可以直接返回输入端，而且设置有足够地缓冲寄存器，若以最快的方式用该流水计算：∏（Ai＋Bi）（其中i＝1..4，∏为连乘符号）（1）画出其处理过程的时空图。

（2）计算其实际的吞吐率、加速比和效率。 1) 先计算A1+B1、A2+B2、A3+B3和A4+B4；再计算(A1+B1)×(A2+B2)和(A3+B3)×(A4+B4)；然后求总的乘积结果。时空图：

段 8 7 6 5 4 3 2 1 A B C D A×B C×D A×B×C×D A=A1+B1 B=A2+B2 C=A3+B3 D=A4+B4 输 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 A1 A2 A3 A4 A C A×B B1 B2 B3 B4 B D C×D 时间入

搜索更多关于：北京科技大学计算机体系结构总复习汇总（无重复带计算）的文档

版权认领

下载文档10.00 元 加入VIP免费下载

推荐下载

本文作者：...

共分享92篇相关文档

文档简介：

2）从目标处调度：分支转移成功时，可以提高流水线性能，但由于复制指令，可能加大程序空间。 3）从失败处调度：分支转移失败时，可以提高流水线性能。但如果分支转移成功，必须保证被调度的指令对程序的执行没有影响。 12、表示寻址方式的主要方法有哪些？简述它们的优缺点。 1）将寻址方式编于操作码中，由操作码在描述指令的同时也描述了相应的寻址方式。这种方式译码快，但操作码和寻址方式的结合不仅增加了指令的条数，导致了指令的多样性，而且增加了CPU对指令译码的难度。 2）为每个操作数设臵一个地址描述符，由该地址描述符表示相应操作数的寻址方式。这种方式译码较慢，但操作码和寻址独立，易于指令扩展。 13、简述“Cache－主存”层次与“主存－辅存”层次的区别。目的存储管理的实现访问速度的比值（1级：2级）典型的块（页）大小 C

北京科技大学计算机体系结构总复习汇总（无重复带计算）

相关文档

相关推荐