최신 CPU에선 scalar 연산이 SIMD보다 빠를 수도 있더라
2016/04/01 - 연산 결과를 0~255 이내로 하는 가장 빠른 방법은? 무어의 법칙이 사실상 깨진 것이나 다름 없고, 수년 전부터 CPU 성능의 향상은 클럭 속도 향상보다는 병렬처리 쪽에 더 힘이 실리고 있다. 이를 위해 다중 코어 프로세서가 일반화되었고, 다양한 SIMD 기술들이 적용되고 있다. 또한, 컴파일러에서도 지시자를 통한 OpenMP, 자동 병렬화 및 SIMD의 intrinsic 함수를 원활히 지원하는 추세이다. 이미지 리샘플링을 구현하면서 다중 코어 활용 기술과 SIMD를 모두 적용해서 최대한의 성능을 발휘하도록 해뒀다. 그런데, 이 구현 방식들 간에 어느 정도나 성능 차이가 발생하는지 확인을 해보고 싶어졌다. 구현한 리샘플링은 Lanczos3 및 Mitchell-Netravali 두..