728x90
1. 루프라인 모델
- 연산 강도에 따라 정해지는 커널 성능의 상한치
2. 루프라인 최적화 - 커널의 계산 병목 감소
- 부동 소수점 연산의 혼합
- 동일한 수의 덧셈과 곱셈을 거의 동시에 수행해야 좋은 성능 기대 가능
- 컴퓨터가 곱셈-덧셈 융합 명령어를 지원하거나, 부동 소수점 유닛이 같은 수의 덧셈, 곱셈기를 가지고 있기 때문
- 명령어 수준 병렬성 및 SIMD 적용
- 컴파일러가 생성하는 코드의 ILP가 증가하도록 코드 개선
3. 루프라인 최적화 - 메모리 병목 감소
- 소프트웨어 선인출
- 많은 메모리 작업들이 계속 진행되어야 함
- 예측 접근을 수행
- 메모리 친화도
- 메모리 제어기를 포함하여 같은 메모리-프로세서 쌍에 할당
728x90
'CS > 컴퓨터구조' 카테고리의 다른 글
창고 규모의 컴퓨터 (WSC) (0) | 2023.02.25 |
---|---|
컴퓨터 클러스터 (0) | 2023.02.25 |
도메인에 특화된 구조(DSA)란 (0) | 2023.02.24 |
캐시의 일관성 유지 (0) | 2023.02.21 |
캐시 제어를 위한 유한상태기 (0) | 2023.02.21 |