大连理工大学实验报告
计算机系统结构实验
实验三指令调度和延迟分支
学院(系):电子信息与电气工程学部 专业:计算机科学与技术 学生姓名: 班级: 学号:
大连理工大学
Dalian University of Technology
实验三指令调度和延迟分支
一、实验目的和要求
(1) (2) (3) (4) (5)
加深对指令调度技术的理解。 加深对延迟分支技术的理解。
熟练掌握用指令调度技术解决流水线中的数据冲突的方法。 进一步理解指令调度技术对CPU性能的改进。 进一步理解延迟分支技术对CPU性能的改进。
二、实验步骤与操作方法
1、启动MIPSsim。
2、根据前面的相关知识中关于流水线各段操作的描述,进一步理解流水线窗口中各段的功能,掌握各流水寄存器的含义。
3、选择“配置”->“流水方式”选项,使模拟器工作于流水方式下。 4、用指令调度技术解决流水线中的数据冲突。 (1)启动MIPSsim。 (2)加载schedule.s。 (3)关闭定向功能。
(4)执行所载入的程序。通过查看统计数据和时钟周期图,找出并记录程序执行过程中各种冲突发生的次数、发生冲突的指令组合以及程序执行的总时钟周期数。
(5)采用指令调度技术对程序进行指令调度,消除冲突。将调度后的程序存到after-schedule.s中。 (6)载入after-schedule.s。
(7)执行该程序。观察程序在流水线中的执行情况,记录程序执行的总时钟周期数。 (8)根据记录结果,比较调度前和调度后的性能。论述指令调度对于提高CPU性能的作用。 5、用延迟分支减少分支指令对性能的影响。 (1)启动MIPSsim。 (2)载入branch.s。 (3)关闭延迟分支功能。
(4)执行该程序。观察并记录发生分支延迟的时刻。 (5)记录执行该程序所用的总时钟周期数。
(6)假设延迟槽有1个,对branch.s进行指令调度,然后保存到“delayed-branch.s”中。 (7)载入delayed-branch.s。 (8)打开延迟分支功能。
(9)执行该程序。观察其时钟周期图。 (10)记录执行该程序所用的总时钟周期数。 (11)对比上述两种情况下的时钟周期图。
(12)根据记录结果,比较没采用延迟分支和采用了延迟分支的性能之间的不同。论述延迟分支对于提高CPU性能的作用。
三、实验结果与分析
1、指令调度
(1)schedule.s程序
执行所载入的schedule.s程序。统计数据和时钟周期图如下。程序总周期数为33,总停顿17次,其中RAW(先写后读)停顿16次,自陷停顿1次。
图1 schedule.s统计数据
图2 schedule.s 时钟周期图
对于指令调度进行优化。优化有三种方式:从前调度、从目标处调度和从失败处调度。在此,我们采用了从前调度和从目标处调度两种方式。对比发现,从前调度的优化效果比从目标处调度好。下图是源程序和改好的after_schedule.s程序。
图3 scheduld.s图4after_schedule.s
(2)after_schedule.s程序
执行after_schedule.s程序。统计数据和时钟周期图如下。执行周期总数是18个时钟周期,共停顿2次,其中RAW停顿1次,自陷停顿1次。
图5 after_schedule.s统计数据图
图6 after_schedule.s时钟周期图
(3)调度前后比较与分析
实验数据表明调度前总周期33条,停顿17次;调度后总周期为18,停顿2次。性能提升将近一倍。可以看出在一定条件下,指令调度对于CPU性能的提升有很大的作用。
当然这提升同运行的程序及指令调度的方法有很大的关系。对于不同的程序可以提升的最大性能是不一样的。而不同的指令调度方法对于CPU性能的提升也有很大的影响。
所以使用有效的正确的算法来进行指令调度是很有必要的,这样既能节约安排指令调度的时间,又能使CPU的性能尽可能的得到提升。
2.延迟分支
(1)branch.s程序:执行程序,发生分支延迟的时刻如图7中红线处。程序总时钟周期数
为38,其中控制停顿为2。数据统计如图8所示。
图7 branch.s时钟周期图
图8 branch.s数据统计图
(2)delayed_branch.s程序
对branch.s进行延迟分支调度,调度后程序如下所示。其中程序将SW $r1,0($r2) 设置为延迟槽指令。
图9 delayed_branch.s程序
打开延迟分支功能,执行程序。时钟周期总数为32,控制停顿为0。
图10 时钟周期图
图11 统计数据图
(3)调度前后比较与分析
实验数据表明调度前总周期38条,控制停顿2次;调度后总周期为32,停顿0次。控制停顿
已消除。可以看出在一定条件下,采用延迟分支可以提升CPU的性能。
对于不同的程序可以提升的最大性能是不一样的。不同的调度方法对于CPU性能的提升也有的影响,从前调度,从目标代码处调度,从失败处调度,对于不同的程序这几种方法提升的性能是不同的。
同时可以看到在设置延迟分支前数据冲突为16次,设置后数据冲突为12次。这是因为在使用延迟分支同时恰好相当于使用了指令调度,减少了一部分数据冲突。所以可见设置延迟分支与调度指令都可以较好地提高CPU性能。
四、讨论、建议、质疑