1. 루프라인 모델 연산 강도에 따라 정해지는 커널 성능의 상한치 2. 루프라인 최적화 - 커널의 계산 병목 감소 부동 소수점 연산의 혼합 동일한 수의 덧셈과 곱셈을 거의 동시에 수행해야 좋은 성능 기대 가능 컴퓨터가 곱셈-덧셈 융합 명령어를 지원하거나, 부동 소수점 유닛이 같은 수의 덧셈, 곱셈기를 가지고 있기 때문 명령어 수준 병렬성 및 SIMD 적용 컴파일러가 생성하는 코드의 ILP가 증가하도록 코드 개선 3. 루프라인 최적화 - 메모리 병목 감소 소프트웨어 선인출 많은 메모리 작업들이 계속 진행되어야 함 예측 접근을 수행 메모리 친화도 메모리 제어기를 포함하여 같은 메모리-프로세서 쌍에 할당