0% found this document useful (0 votes)

59 views

Modulo15 RiscV DDCArv Ch7

The document discusses pipelining a RISC-V processor to improve its throughput. It describes how the processor is divided into 5 stages - fetch, decode, execute, memory, and writeback - with pipeline registers between each stage. This allows multiple instructions to be in different stages of processing simultaneously, improving instruction throughput compared to a single-cycle processor where only one instruction progresses at a time. An example is given comparing the processing of instructions over time in a single-cycle versus pipelined processor.

Uploaded by

Gabriel Bertolazi

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

59 views

Modulo15 RiscV DDCArv Ch7

Uploaded by

Gabriel Bertolazi

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 34

Chapter 7: Microarchitecture

Pipelined RISCV
Processor
Pipelined RISCV Processor
• Temporal parallelism
• Divide singlecycle processor into 5 stages:
– Fetch
– Decode
– Execute
– Memory
– Writeback
• Add pipeline registers between stages

102 Digital Design & Computer Architecture Microarchitecture

SingleCycle vs. Pipelined Processor
SingleCycle
0 100 200 300 400 500 600 700 800 900 1000 1100 1200 1300 1400 1500
Instr
Time (ps)
Dec
1 Fetch Execute Memory Wr
Read
Instruction ALU Read / Write Reg
Reg
Dec
2 Fetch Execute Memory Wr
Read
Instruction ALU Read / Write Reg
Reg

Instr
Pipelined
Dec
1 Fetch Execute Memory Wr
Read
Instruction ALU Read / Write Reg
Reg
Dec
2 Fetch Execute Memory Wr
Read
Instruction ALU Read / Write Reg
Reg
Dec
3 Fetch Execute Memory Wr
Read
Instruction ALU Read / Write Reg
Reg

103 Digital Design & Computer Architecture Microarchitecture

Pipelined Processor Abstraction
1 2 3 4 5 6 7 8 9 10

Time (cycles)
s0
lw DM s2
lw s2, 40(s0) IM RF 40 + RF

s9
add DM s3
add s3, s9, s10 IM RF s10 + RF

t1
sub DM s4
sub s4, t1, s8 IM RF s8 - RF

s11
and DM s5
and s5, s11, t0 IM RF t0 & RF

t4
sw DM
sw s6, 20(t4) IM RF 20 + RF

t2
or DM s7
or s7, t2, t3 IM RF t3 | RF

104 Digital Design & Computer Architecture Microarchitecture

SingleCycle & Pipelined Datapaths
CLK
CLK SingleCycle CLK

19:15 WE3 SrcAE WE

0 PC' PC Instr A1 RD1 Zero
A RD ReadData 00

ALU
1 ALUResult
A RD 01
Instruction 24:20 10
A2 RD2 0 SrcBE Data
Memory 11:7
A3 1 Memory
Register WriteData
WD3 WD
File
PCTarget

+
+
4 ImmExt
31:7 Extend

PCPlus4

Result

Pipelined
CLK CLK CLK

Zero
CLK

Signals in 0 PCF' PCF

A RD
InstrD
19:15
A1
WE3
RD1
RD1E SrcAE WE
00

ALU
1 ALUResultM ReadDataW
RD2E A RD 01
Instruction

Pipelined
24:20 10
A2 RD2 0 SrcBE Data
Memory 11:7
A3 1 Memory
Register WriteDataE WriteDataM
WD3 WD

Processor are File

PCD PCE

+
appended with
+

first letter of 4
31:7 Extend
ImmExtD ImmExtE

stage (i.e., PCF, PCPlus4F PCPlus4D PCPlus4E

PCTargetE
PCPlus4M
PCPlus4W

PCD, PCE).
ResultW

Fetch Decode Execute Memory Writeback

105 Digital Design & Computer Architecture Microarchitecture

Corrected Pipelined Datapath
CLK CLK CLK
CLK
19:15 WE3 RD1E SrcAE WE
0 PCF' PCF InstrD A1 RD1
A RD ReadDataW 00

ALU
1 ALUResultM
RD2E A RD 01
Instruction 24:20 10
A2 RD2 0 SrcBE Data
Memory
A3 1 Memory
Register WriteDataE WriteDataM
WD3 WD
File
PCD PCE

+
11:7 RdD RdE RdM RdW
+

4 ImmExtD ImmExtE
31:7 Extend

PCPlus4F PCPlus4D PCPlus4E PCPlus4M

PCPlus4W
PCTargetE

ResultW

• Rd must arrive at same time as Result

• Register file written on falling edge of CLK

106 Digital Design & Computer Architecture Microarchitecture

Pipelined Processor with Control
PCSrcE
ZeroE
CLK CLK CLK

RegWriteD RegWriteE RegWriteM RegWriteW

Control ResultSrcD1:0 ResultSrcE1:0 ResultSrcM1:0 ResultSrcW1:0
Unit
MemWriteD MemWriteE MemWriteM
JumpD JumpE

6:0
BranchD BranchE
op ALUControlD2:0 ALUControlE2:0
14:12
funct3
30
ALUSrcD ALUSrcE
funct75
ImmSrcD1:0

CLK CLK CLK

CLK
19:15 WE3 RD1E SrcAE WE
0 PCF' PCF InstrD A1 RD1
A RD ReadDataW 00

ALU
1 ALUResultM
RD2E A RD 01
Instruction 24:20 10
A2 RD2 0 SrcBE Data
Memory
A3 1 Memory
Register WriteDataE WriteDataM
WD3 WD
File
PCD PCE

+
11:7 RdD RdE RdM RdW
+

4 ImmExtD ImmExtE
31:7 Extend

PCPlus4F PCPlus4D PCPlus4E PCPlus4M

PCPlus4W
PCTargetE

ResultW

• Same control unit as singlecycle processor

• Control signals travel with the instruction (drop off when used)
107 Digital Design & Computer Architecture Microarchitecture
Chapter 7: Microarchitecture

Pipelined Processor
Hazards
Pipelined Hazards
• When an instruction depends on result from
instruction that hasn’t completed
• Types:
– Data hazard: register value not yet written back to
register file
– Control hazard: next instruction not decided yet
(caused by branch)

109 Digital Design & Computer Architecture Microarchitecture

Data Hazard
1 2 3 4 5 6 7 8

Time (cycles)
s4
add DM s8
add s8, s4, s5 IM RF s5 + RF

s8
sub DM s2
sub s2, s8, s3 IM RF s3 - RF

t6
or DM s9
or s9, t6, s8 IM RF s8 | RF

s8
and DM s7
and s7, s8, t2 IM RF t2 & RF

110 Digital Design & Computer Architecture Microarchitecture

Handling Data Hazards
• Insert nops in code at compile time
• Rearrange code at compile time
• Forward data at run time
• Stall the processor at run time

111 Digital Design & Computer Architecture Microarchitecture

Handling Data Hazards
• Insert enough nops for result to be ready
• Or move independent useful instructions forward
1 2 3 4 5 6 7 8 9 10

Time (cycles)
s4
add DM s8
add s8, s4, s5 IM RF s5 + RF

nop DM
nop IM RF RF

s8
sub DM s2
sub s2, s8, s3 IM RF s3 - RF

t6
or DM s9
or s9, t6, s8 IM RF s8 | RF

s8
and DM s7
and s7, s8, t2 IM RF t2 & RF

112 Digital Design & Computer Architecture Microarchitecture

Data Forwarding
• Data is available on internal busses before it is written
back to the register file (RF).
• Forward data from internal busses to Execute stage.

1 2 3 4 5 6 7 8

Time (cycles)
s4
add DM s8
add s8, s4, s5 IM RF s5 + RF

s8
sub DM s2
sub s2, s8, s3 IM RF s3 - RF

t6
or DM s9
or s9, t6, s8 IM RF s8 | RF

s8
and DM s7
and s7, s8, t2 IM RF t2 & RF

113 Digital Design & Computer Architecture Microarchitecture

Data Forwarding
• Check if source register in Execute stage matches
destination register of instruction in Memory or
Writeback stage.
• If so, forward result.
1 2 3 4 5 6 7 8

Time (cycles)
s4
add DM s8
add s8, s4, s5 IM RF s5 + RF

s8
sub DM s2
sub s2, s8, s3 IM RF s3 - RF

t6
or DM s9
or s9, t6, s8 IM RF s8 | RF

s8
and DM s7
and s7, s8, t2 IM RF t2 & RF

114 Digital Design & Computer Architecture Microarchitecture

Data Forwarding: Hazard Unit
PCSrcE ZeroE
CLK CLK CLK

RegWriteD RegWriteE RegWriteM RegWriteW

Control ResultSrcD1:0 ResultSrcE1:0 ResultSrcM1:0 ResultSrcW1:0
Unit
MemWriteD MemWriteE MemWriteM
JumpD JumpE

6:0
BranchD BranchE
op ALUControlD2:0 ALUControlE2:0
14:12
funct3
30
ALUSrcD ALUSrcE
funct75
ImmSrcD1:0

CLK CLK CLK

CLK
19:15 WE3 RD1E SrcAE WE
0 PCF' PCF InstrD A1 RD1 00
A RD 01 ReadDataW 00

ALU
1 10 ALUResultM
RD2E A RD 01
Instruction 24:20 10
A2 RD2 00 0 SrcBE Data
Memory 01
A3 10 1 Memory
Register WriteDataE WriteDataM
WD3 WD
File
PCD PCE

+
19:15 Rs1D Rs1E
24:20 Rs2D Rs2E
11:7 RdD RdE RdM RdW
+

4 ExtImmD ExtImmE
31:7 Extend

PCPlus4F PCPlus4D PCPlus4E PCPlus4M

PCPlus4W
PCTargetE

ResultW

ForwardAE
ForwardBE

Hazard Unit

115 Digital Design & Computer Architecture Microarchitecture

Data Forwarding
• Case 1: Execute stage Rs1 or Rs2 matches Memory stage Rd?
Forward from Memory stage
• Case 2: Execute stage Rs1 or Rs2 matches Writeback stage Rd?
Forward from Writeback stage
• Case 3: Otherwise use value read from register file (as usual)

Equations for Rs1:

if ((Rs1E == RdM) AND RegWriteM) // Case 1
ForwardAE = 10
else if ((Rs1E == RdW) AND RegWriteW) // Case 2
ForwardAE = 01
else ForwardAE = 00 // Case 3

ForwardBE equations are similar (replace Rs1E with Rs2E)

116 Digital Design & Computer Architecture Microarchitecture
Data Forwarding
• Case 1: Execute stage Rs1 or Rs2 matches Memory stage Rd?
Forward from Memory stage
• Case 2: Execute stage Rs1 or Rs2 matches Writeback stage Rd?
Forward from Writeback stage
• Case 3: Otherwise use value read from register file (as usual)

Equations for Rs1:

if ((Rs1E == RdM) AND RegWriteM) AND (Rs1E != 0) // Case 1
ForwardAE = 10
else if ((Rs1E == RdW) AND RegWriteW) AND (Rs1E != 0) // Case 2
ForwardAE = 01
else ForwardAE = 00 // Case 3

ForwardBE equations are similar (replace Rs1E with Rs2E)

117 Digital Design & Computer Architecture Microarchitecture
Data Hazard due to lw Dependency
1 2 3 4 5 6 7 8

Time (cycles)
s5
lw DM s7
lw s7, 40(s5) IM RF 40 + RF

Trouble!
s7
and DM s8
and s8, s7, t3 IM RF t3 & RF

s6
or DM t2
or t2, s6, s7 IM RF s7 | RF

s7
sub DM s3
sub s3, s7, s2 IM RF s2 - RF

118 Digital Design & Computer Architecture Microarchitecture

Stalling to solve lw Data Dependency
1 2 3 4 5 6 7 8 9

Time (cycles)
s5
lw DM s7
lw s7, 40(s5) IM RF 40 + RF

s7 s7
and DM s8
and s8, s7, t3 IM RF t3 RF t3 & RF

s6
or or DM t2
or t2, s6, s7 IM IM RF s7 | RF

Stall s7
sub DM s3
sub s3, s7, s2 IM RF s2 - RF

119 Digital Design & Computer Architecture Microarchitecture

Stalling Logic
• Is either source register in the Decode stage the
same as the destination register in the Execute
stage?
AND
• Is the instruction in the Execute stage a lw?

lwStall = ((Rs1D == RdE) OR (Rs2D == RdE)) AND ResultSrcE1

StallF = StallD = FlushE = lwStall

(Stall the Fetch and Decode stages, and flush the Execute stage.)

120 Digital Design & Computer Architecture Microarchitecture

Stalling Hardware
PCSrcE ZeroE
CLK CLK CLK

RegWriteD RegWriteE RegWriteM RegWriteW

Control ResultSrcD1:0 ResultSrcE1:0 ResultSrcM1:0 ResultSrcW1:0
Unit 0
MemWriteD MemWriteE MemWriteM
JumpD JumpE

6:0
BranchD BranchE
op ALUControlD2:0 ALUControlE2:0
14:12
funct3
30
ALUSrcD ALUSrcE
funct75
ImmSrcD1:0

CLK CLK CLK

CLK
19:15 WE3 RD1E SrcAE WE
0 PCF' PCF InstrD A1 RD1 00
A RD 01 ReadDataW 00

ALU
1 10 ALUResultM
EN

RD2E A RD 01
Instruction 24:20 10
A2 RD2 00 0 SrcBE Data
Memory 01
A3 10 1 Memory
Register WriteDataE WriteDataM
WD3 WD
File
PCD PCE

+
19:15 Rs1D Rs1E
24:20 Rs2D Rs2E
11:7 RdD RdE RdM RdW
+

4 ExtImmD ExtImmE
31:7 Extend

PCPlus4F PCPlus4D PCPlus4E PCPlus4M

CLR
EN

PCPlus4W
PCTargetE

ResultW

ResultSrcE0
ForwardAE
ForwardBE
FlushE
StallD
StallF

Hazard Unit

121 Digital Design & Computer Architecture Microarchitecture

Chapter 7: Microarchitecture

Pipelined Processor
Control Hazards
Control Hazards
• beq:
– Branch not determined until the Execute stage of
pipeline
– Instructions after branch fetched before branch
occurs
– These 2 instructions must be flushed if branch
happens

123 Digital Design & Computer Architecture Microarchitecture

Control Hazards
1 2 3 4 5 6 7 8 9 10

Time (cycles)
s1
beq DM
20 beq s1, s2, L1 IM RF s2 - RF

t1
sub DM
24 sub s8, t1, s3 IM RF s3 RF Flush
these
or
28 or s9, t6, s5 IM RF DM RF instructions

2C ...
... ...
s3
add DM s7
58 L1: add s7, s3, s4 IM RF s4 + RF

Branch misprediction penalty:

The number of instructions flushed when a branch is taken (in
this case, 2 instructions)

124 Digital Design & Computer Architecture Microarchitecture

Control Hazards: Flushing Logic
• If branch is taken in execute stage, need to
flush the instructions in the Fetch and
Decode stages
– Do this by clearing Decode and Execute Pipeline
registers using FlushD and FlushE
• Equations:
FlushD = PCSrcE
FlushE = lwStall OR PCSrcE

125 Digital Design & Computer Architecture Microarchitecture

Control Hazards: Flushing Hardware
PCSrcE
ZeroE
CLK CLK CLK

RegWriteD RegWriteE RegWriteM RegWriteW

Control ResultSrcD1:0 ResultSrcE1:0 ResultSrcM1:0 ResultSrcW1:0
Unit 0
MemWriteD MemWriteE MemWriteM
JumpD JumpE

6:0
BranchD BranchE
op ALUControlD2:0 ALUControlE2:0
14:12
funct3
30
ALUSrcD ALUSrcE
funct75
ImmSrcD1:0

CLK CLK CLK

CLK
19:15 WE3 RD1E SrcAE WE
0 PCF' PCF InstrD A1 RD1 00
A RD 01 ReadDataW 00

ALU
1 10 ALUResultM
EN

A RD 01
Instruction 24:20 RD2E 10
A2 RD2 00 0 SrcBE Data
Memory 01
A3 10 1 Memory
Register WriteDataE WriteDataM
WD3 WD
File
PCD PCE

+
19:15 Rs1D Rs1E
24:20 Rs2D Rs2E
11:7 RdD RdE RdM RdW
+

4 ExtImmD ExtImmE
31:7 Extend

PCPlus4F PCPlus4D PCPlus4M

CLR

CLR
EN

PCPlus4W
PCTargetE

ResultW

ForwardAE
ForwardBE
FlushD

FlushE
StallD
StallF

Hazard Unit

126 Digital Design & Computer Architecture Microarchitecture

RISCV Pipelined Processor with Hazard Unit
PCSrcE
ZeroE
CLK CLK CLK

RegWriteD RegWriteE RegWriteM RegWriteW

Control ResultSrcD1:0 ResultSrcE1:0 ResultSrcM1:0 ResultSrcW1:0
Unit 0
MemWriteD MemWriteE MemWriteM
JumpD JumpE

6:0
BranchD BranchE
op
14:12
ALUControlD2:0 ALUControlE2:0
funct3
30
ALUSrcD ALUSrcE
funct75
ImmSrcD1:0

CLK CLK CLK

CLK
19:15 WE3 RD1E SrcAE WE
0 PCF' PCF InstrD A1 RD1 00
A RD 01 00

ALU
1 10 ALUResultM ReadDataW
EN

A RD 01
Instruction 24:20 RD2E 10
A2 RD2 00 0 SrcBE Data
Memory 01
A3 10 1 Memory
Register WriteDataE WriteDataM
WD3 WD
File
PCD PCE

+
19:15 Rs1D Rs1E
24:20 Rs2D Rs2E
11:7 RdD RdE RdM RdW
+

4 ExtImmD ExtImmE
31:7 Extend

PCPlus4F PCPlus4D PCPlus4E PCPlus4M

CLR

CLR
EN

PCPlus4W
PCTargetE

ResultW

ForwardAE
ForwardBE
FlushD

FlushE
StallD
StallF

Hazard Unit

127 Digital Design & Computer Architecture Microarchitecture

Chapter 7: Microarchitecture

Pipelined
Performance
Pipelined Processor Performance Example
• SPECINT2000 benchmark:
– 25% loads
– 10% stores
– 13% branches
– 52% Rtype
• Suppose:
– 40% of loads used by next instruction
– 50% of branches mispredicted
• What is the average CPI? (Ideally it’s 1, but…)
– Load CPI = 1 when not stalling, 2 when stalling
So, CPIlw = 1(0.6) + 2(0.4) = 1.4
– Branch CPI = 1 when not stalling, 3 when stalling
So, CPIbeq = 1(0.5) + 3(0.5) = 2

Average CPI = (0.25)(1.4) + (0.1)(1) + (0.13)(2) + (0.52)(1) = 1.23

129 Digital Design & Computer Architecture Microarchitecture

Pipelined Processor Performance Example
Pipelined processor critical path:
Tc_pipelined = max of
tpcq + tmem + tsetup Fetch
2(tRFread + tsetup ) Decode
tpcq + 4tmux + tALU + tANDOR + tsetup Execute
tpcq + tmem + tsetup Memory
2(tpcq + tmux + tRFwrite) Writeback

• Decode and Writeback stages both use the register file in each cycle
• So each stage gets half of the cycle time (Tc/2) to do their work
• Or, stated a different way, 2x of their work must fit in a cycle (Tc)

130 Digital Design & Computer Architecture Microarchitecture

Pipelined Critical Path: Execute Stage
PCSrcE
ZeroE
CLK CLK CLK

RegWriteD RegWriteE RegWriteM RegWriteW

Control ResultSrcD1:0 ResultSrcE1:0 ResultSrcM1:0 ResultSrcW1:0
Unit 0
MemWriteD MemWriteE MemWriteM
JumpD JumpE

6:0
BranchD BranchE
op ALUControlD2:0 ALUControlE2:0
14:12
funct3
30
ALUSrcD ALUSrcE
funct75
ImmSrcD1:0

CLK CLK CLK

CLK
19:15 WE3 RD1E SrcAE WE
0 PCF' PCF InstrD A1 RD1 00
A RD 01 00

ALU
1 10 ALUResultM ReadDataW
EN

A RD 01
Instruction 24:20 RD2E 10
A2 RD2 00 0 SrcBE Data
Memory 01
A3 10 1 Memory
Register WriteDataE WriteDataM
WD3 WD
File
PCD PCE

+
19:15 Rs1D Rs1E
24:20 Rs2D Rs2E
11:7 RdD RdE RdM RdW
+

4 ExtImmD ExtImmE
31:7 Extend

PCPlus4F PCPlus4D PCPlus4E PCPlus4M

CLR

CLR
EN

PCPlus4W
PCTargetE

ResultW

ForwardAE
ForwardBE
FlushD

FlushE
StallD
StallF

Hazard Unit

131 Digital Design & Computer Architecture Microarchitecture

Pipelined Performance Example
Element Parameter Delay (ps)
Register clocktoQ tpcq_PC 40
Register setup tsetup 50
Multiplexer tmux 30
ANDOR gate tAND-OR 20
ALU tALU 120
Decoder (Control Unit) tdec 25
Extend unit tdec 35
Memory read tmem 200
Register file read tRFread 100
Register file setup tRFsetup 60
Tc_pipelined = tpcq + 4tmux + tALU + tAND-OR + tsetup
= (40 + 4*30 + 120 + 20 + 50) ps = 350 ps
132 Digital Design & Computer Architecture Microarchitecture
Pipelined Performance Example
Program with 100 billion instructions
Execution Time = (# instructions) × CPI × Tc
= (100 × 109)(1.23)(350 × 1012)
= 43 seconds

133 Digital Design & Computer Architecture Microarchitecture

Processor Performance Comparison
Execution
Time Speedup
Processor (seconds) (singlecycle as baseline)
Singlecycle 75 1
Multicycle 155 0.5
Pipelined 43 1.7

134 Digital Design & Computer Architecture Microarchitecture

Firmware Upgrade Procedure For The L90 Line Differential Relay
No ratings yet
Firmware Upgrade Procedure For The L90 Line Differential Relay
7 pages
Mikroarsitektur 1
No ratings yet
Mikroarsitektur 1
33 pages
DDCArv_Ch7 (1)
No ratings yet
DDCArv_Ch7 (1)
57 pages
Digital Design and Computer Architecture, 2: Edition
100% (1)
Digital Design and Computer Architecture, 2: Edition
134 pages
DDCA Ch7
No ratings yet
DDCA Ch7
76 pages
Chapter 7 Lecture Slides
No ratings yet
Chapter 7 Lecture Slides
76 pages
Pic
100% (1)
Pic
94 pages
Fingur+gsm Based Locker System
No ratings yet
Fingur+gsm Based Locker System
48 pages
Unit 1: 1.1 Microprocessors and Microcontrollers
No ratings yet
Unit 1: 1.1 Microprocessors and Microcontrollers
13 pages
1-PIC Uc
No ratings yet
1-PIC Uc
30 pages
Microcontroller 8051 (1)
No ratings yet
Microcontroller 8051 (1)
45 pages
MM 11
No ratings yet
MM 11
41 pages
461 Assignment
No ratings yet
461 Assignment
52 pages
Modulo15b RiscV DDCArv Ch7
No ratings yet
Modulo15b RiscV DDCArv Ch7
26 pages
Lab 1 COAL
No ratings yet
Lab 1 COAL
5 pages
Computer Architecture Note by Redwan (UptoMemorySystem)
100% (1)
Computer Architecture Note by Redwan (UptoMemorySystem)
64 pages
Microcontroller Notes MODULE 1
100% (2)
Microcontroller Notes MODULE 1
49 pages
General Purpose Processor
No ratings yet
General Purpose Processor
13 pages
MES (Mod-1)
No ratings yet
MES (Mod-1)
59 pages
Advanced Microcontroller: Department of Electronics and Telecommunication Engineering
No ratings yet
Advanced Microcontroller: Department of Electronics and Telecommunication Engineering
56 pages
03 Cpu Overview
No ratings yet
03 Cpu Overview
86 pages
Lecture Notes-Computer Architecture-Module 1
No ratings yet
Lecture Notes-Computer Architecture-Module 1
20 pages
Tut3 Architecture
No ratings yet
Tut3 Architecture
62 pages
Integration of Electronic Speed Governor With RFID Technology For Speed Limiting
100% (1)
Integration of Electronic Speed Governor With RFID Technology For Speed Limiting
86 pages
8051
No ratings yet
8051
90 pages
Design and Implementation of a 32-bit ISA RISC-V
No ratings yet
Design and Implementation of a 32-bit ISA RISC-V
5 pages
Unit 2 MPMC Notes
No ratings yet
Unit 2 MPMC Notes
37 pages
Superscalar Architectures: COMP375 Computer Architecture and Organization
No ratings yet
Superscalar Architectures: COMP375 Computer Architecture and Organization
35 pages
Digital Design and Computer Architecture: ARM® Edition: Sarah L. Harris and David Money Harris
No ratings yet
Digital Design and Computer Architecture: ARM® Edition: Sarah L. Harris and David Money Harris
28 pages
basicfunctionalunit-190124043726
No ratings yet
basicfunctionalunit-190124043726
37 pages
2. Microprocessor Microcontroller Architecture
No ratings yet
2. Microprocessor Microcontroller Architecture
46 pages
Design of 32-Bit Risc Processor and Efficient Verification
No ratings yet
Design of 32-Bit Risc Processor and Efficient Verification
6 pages
Classification of 8051
No ratings yet
Classification of 8051
15 pages
Real Time System Lect10 A
No ratings yet
Real Time System Lect10 A
25 pages
chpt1 - ARM Embedded System
No ratings yet
chpt1 - ARM Embedded System
17 pages
Cs/Coe 1541: Single and Multi-Cycle Implementations
No ratings yet
Cs/Coe 1541: Single and Multi-Cycle Implementations
93 pages
Physical Design Implementation of 16 Bit Risc Processor
No ratings yet
Physical Design Implementation of 16 Bit Risc Processor
7 pages
Slides Chapter 5 Basic Processing Unit
No ratings yet
Slides Chapter 5 Basic Processing Unit
44 pages
Esd Toc PDF
No ratings yet
Esd Toc PDF
9 pages
Evolution of Microprocessors
No ratings yet
Evolution of Microprocessors
35 pages
Embedded Systems Design-1: Dr. N. Mathivanan
No ratings yet
Embedded Systems Design-1: Dr. N. Mathivanan
35 pages
Embedded System Design Module
No ratings yet
Embedded System Design Module
35 pages
Unit IV ARM - 470480110
No ratings yet
Unit IV ARM - 470480110
44 pages
ED Unit-1
No ratings yet
ED Unit-1
83 pages
Unit 3 Basic Processing Unit
No ratings yet
Unit 3 Basic Processing Unit
42 pages
MIPS Report File
No ratings yet
MIPS Report File
17 pages
Chapter 1 Intro To Micropro
No ratings yet
Chapter 1 Intro To Micropro
22 pages
Microcontrollers and Applications
No ratings yet
Microcontrollers and Applications
254 pages
Chap1 Intro
No ratings yet
Chap1 Intro
30 pages
Design & Simulation of A 32-Bit Risc Based Mips Processor Using Verilog
No ratings yet
Design & Simulation of A 32-Bit Risc Based Mips Processor Using Verilog
7 pages
Unit 2 Arm7
No ratings yet
Unit 2 Arm7
67 pages
15IF11 Multicore A PDF
No ratings yet
15IF11 Multicore A PDF
64 pages
Lecture13 Pipeline1
No ratings yet
Lecture13 Pipeline1
26 pages
MPMC - Unit 1 - 8085 Architecture
No ratings yet
MPMC - Unit 1 - 8085 Architecture
17 pages
Arch4 Pipelined Processor Design Afterlecture
No ratings yet
Arch4 Pipelined Processor Design Afterlecture
130 pages
ESD 03 ARM Architecture
100% (1)
ESD 03 ARM Architecture
37 pages
ARM Basics
No ratings yet
ARM Basics
132 pages
L03-Pipelining
No ratings yet
L03-Pipelining
45 pages
Presentation - ARM processors
No ratings yet
Presentation - ARM processors
31 pages
Scanning Networks: Pre-Assessment
No ratings yet
Scanning Networks: Pre-Assessment
9 pages
Sample Configuration of EtherChannel - Link Aggregation Control Protocol...
No ratings yet
Sample Configuration of EtherChannel - Link Aggregation Control Protocol...
8 pages
VP CN Record
No ratings yet
VP CN Record
74 pages
Debug 1214
No ratings yet
Debug 1214
4 pages
Polyvision TS Series
No ratings yet
Polyvision TS Series
2 pages
PC Maintenance Done
No ratings yet
PC Maintenance Done
13 pages
Guia de Curso HP2-E58
No ratings yet
Guia de Curso HP2-E58
48 pages
Thrashing in OS (Operating System) - What Is Thrash - Javatpoint
No ratings yet
Thrashing in OS (Operating System) - What Is Thrash - Javatpoint
7 pages
Z/Os Hardware Management Console (HMC)
No ratings yet
Z/Os Hardware Management Console (HMC)
25 pages
XL C-C++ Programming Guide PDF
100% (1)
XL C-C++ Programming Guide PDF
1,088 pages
Bcom 1st Sem Fit Lab Record
No ratings yet
Bcom 1st Sem Fit Lab Record
25 pages
VMware ActualTests 2V0-621 v2016-01-19 by Dweebso 190q
No ratings yet
VMware ActualTests 2V0-621 v2016-01-19 by Dweebso 190q
97 pages
Network Protocols Lab Manual - Lab 10
No ratings yet
Network Protocols Lab Manual - Lab 10
14 pages
Cucm B System-Configuration-Guide-1251 Chapter 01011011
No ratings yet
Cucm B System-Configuration-Guide-1251 Chapter 01011011
24 pages
Installing Oracle Linux 8.5 or Above and R12 Prerequisites - WASA
No ratings yet
Installing Oracle Linux 8.5 or Above and R12 Prerequisites - WASA
17 pages
Process Synchronization
No ratings yet
Process Synchronization
62 pages
Configuring The Shell
No ratings yet
Configuring The Shell
15 pages
AUR (en) - nvidia-340xx
No ratings yet
AUR (en) - nvidia-340xx
4 pages
Neo-Newbie Mar 17, 11 at 7:07pm: Scizoreon
No ratings yet
Neo-Newbie Mar 17, 11 at 7:07pm: Scizoreon
3 pages
Using DB2 For Linux, Windows, and UNIX Table Partitioning in SAP Systems
No ratings yet
Using DB2 For Linux, Windows, and UNIX Table Partitioning in SAP Systems
19 pages
4th Sem RR Campus Course Information
No ratings yet
4th Sem RR Campus Course Information
24 pages
Operating Systems Concepts and Design Milan Milenkovic PDF
50% (4)
Operating Systems Concepts and Design Milan Milenkovic PDF
3 pages
C8051F020 C Programming
No ratings yet
C8051F020 C Programming
22 pages
Bourne Shell Scripting PDF
No ratings yet
Bourne Shell Scripting PDF
132 pages
H820 Usermanual Eng PDF
No ratings yet
H820 Usermanual Eng PDF
138 pages
Probo
No ratings yet
Probo
2 pages
Remedy API Quick Reference
No ratings yet
Remedy API Quick Reference
4 pages
RC Datasheet ISCOM2600G 20160128 PDF
No ratings yet
RC Datasheet ISCOM2600G 20160128 PDF
5 pages

Modulo15 RiscV DDCArv Ch7

Uploaded by

Modulo15 RiscV DDCArv Ch7

Uploaded by

Chapter 7: Microarchitecture

102 Digital Design & Computer Architecture Microarchitecture

103 Digital Design & Computer Architecture Microarchitecture

104 Digital Design & Computer Architecture Microarchitecture

19:15 WE3 SrcAE WE

Signals in 0 PCF' PCF

Processor are File

stage (i.e., PCF, PCPlus4F PCPlus4D PCPlus4E

Fetch Decode Execute Memory Writeback

105 Digital Design & Computer Architecture Microarchitecture

PCPlus4F PCPlus4D PCPlus4E PCPlus4M

• Rd must arrive at same time as Result

106 Digital Design & Computer Architecture Microarchitecture

RegWriteD RegWriteE RegWriteM RegWriteW

CLK CLK CLK

PCPlus4F PCPlus4D PCPlus4E PCPlus4M

• Same control unit as single­cycle processor

109 Digital Design & Computer Architecture Microarchitecture

110 Digital Design & Computer Architecture Microarchitecture

111 Digital Design & Computer Architecture Microarchitecture

112 Digital Design & Computer Architecture Microarchitecture

113 Digital Design & Computer Architecture Microarchitecture

114 Digital Design & Computer Architecture Microarchitecture

RegWriteD RegWriteE RegWriteM RegWriteW

CLK CLK CLK

PCPlus4F PCPlus4D PCPlus4E PCPlus4M

115 Digital Design & Computer Architecture Microarchitecture

Equations for Rs1:

ForwardBE equations are similar (replace Rs1E with Rs2E)

Equations for Rs1:

ForwardBE equations are similar (replace Rs1E with Rs2E)

118 Digital Design & Computer Architecture Microarchitecture

119 Digital Design & Computer Architecture Microarchitecture

lwStall = ((Rs1D == RdE) OR (Rs2D == RdE)) AND ResultSrcE1

120 Digital Design & Computer Architecture Microarchitecture

RegWriteD RegWriteE RegWriteM RegWriteW

CLK CLK CLK

PCPlus4F PCPlus4D PCPlus4E PCPlus4M

121 Digital Design & Computer Architecture Microarchitecture

123 Digital Design & Computer Architecture Microarchitecture

Branch misprediction penalty:

124 Digital Design & Computer Architecture Microarchitecture

125 Digital Design & Computer Architecture Microarchitecture

RegWriteD RegWriteE RegWriteM RegWriteW

CLK CLK CLK

PCPlus4F PCPlus4D PCPlus4M

126 Digital Design & Computer Architecture Microarchitecture

RegWriteD RegWriteE RegWriteM RegWriteW

CLK CLK CLK

PCPlus4F PCPlus4D PCPlus4E PCPlus4M

127 Digital Design & Computer Architecture Microarchitecture

Average CPI = (0.25)(1.4) + (0.1)(1) + (0.13)(2) + (0.52)(1) = 1.23

129 Digital Design & Computer Architecture Microarchitecture

130 Digital Design & Computer Architecture Microarchitecture

RegWriteD RegWriteE RegWriteM RegWriteW

CLK CLK CLK

PCPlus4F PCPlus4D PCPlus4E PCPlus4M

131 Digital Design & Computer Architecture Microarchitecture

133 Digital Design & Computer Architecture Microarchitecture

134 Digital Design & Computer Architecture Microarchitecture

You might also like

• Same control unit as singlecycle processor