CS/컴퓨터구조

멀티프로세서의 성능 측정

박 성 하 2023. 2. 25. 19:07
728x90

1. 루프라인 모델

  • 연산 강도에 따라 정해지는 커널 성능의 상한치

 

 

2. 루프라인 최적화 - 커널의 계산 병목 감소

 

  • 부동 소수점 연산의 혼합
    • 동일한 수의 덧셈과 곱셈을 거의 동시에 수행해야 좋은 성능 기대 가능
    • 컴퓨터가 곱셈-덧셈 융합 명령어를 지원하거나, 부동 소수점 유닛이 같은 수의 덧셈, 곱셈기를 가지고 있기 때문

 

  • 명령어 수준 병렬성 및 SIMD 적용       
    • 컴파일러가 생성하는 코드의 ILP가 증가하도록 코드 개선

 

3. 루프라인 최적화 - 메모리 병목 감소

 

  • 소프트웨어 선인출
    • 많은 메모리 작업들이 계속 진행되어야 함
    • 예측 접근을 수행

 

  • 메모리 친화도
    • 메모리 제어기를 포함하여 같은 메모리-프로세서 쌍에 할당 
728x90

'CS > 컴퓨터구조' 카테고리의 다른 글

창고 규모의 컴퓨터 (WSC)  (0) 2023.02.25
컴퓨터 클러스터  (0) 2023.02.25
도메인에 특화된 구조(DSA)란  (0) 2023.02.24
캐시의 일관성 유지  (0) 2023.02.21
캐시 제어를 위한 유한상태기  (0) 2023.02.21