<aside> 💡
머신을 고려한 최적화 기법
</aside>
<aside> 💡
최신 프로세서의 블록 다이어그램 (CSAPP Fig. 5.11)
</aside>
프로세서에서 많은 인스트럭션들은 동시에 처리
처리 : 명령의 실행 → R, M에 값 Fetch → 연산 수행 → 결과를 R, M에 저장 등
이러한 병렬을 실행하는 동작
프로그램 최대 성능을 결정짓는 하위 경계값 (Lower Bounds)
<aside> 💡
최신 프로세서의 블록 다이어그램 (CSAPP Fig. 5.11)
특징
산업계에서의 Super Scala
다수의 연산을 매 클럭 사이클마다 수행
무순서 수행 - 인스트럭션의 실행 순서 ≠ 기계어 수준 프로그램에서의 순서
</aside>
구조
<aside> 💡
Instruction Control Unit, ICU
</aside>
<aside> 💡
Execution Unit, EU
</aside>
<aside> 💡
Arithmetic Unit
</aside>
<aside> 💡
Latency : 연산 완료까지 필요한 전체 클럭 사이클 수.
Issue Time : 같은 종류의 독립 연산 간의 최소 클럭 사이클 수
Capacity : 해당 연산을 동시에 수행 가능한 유닛 개수
</aside>
<aside> 💡
</aside>