기금넷 공식사이트 - 경제 뉴스 - Kepler GK110 성능

Kepler GK110 성능

NVIDIA는 K20을 "3배 배정밀도 부동 소수점 성능"이라고 설명하며 기존 GK104 아키텍처에서는 사용할 수 없는 Hyper-Q, Dynamic Parallelism 등 다중 병렬 컴퓨팅 기술을 지원합니다.

다른 기능 유닛을 제외하면 GK110 코어에는 총 15세트의 SMX 유닛과 2880개의 CUDA 코어가 있는데 Heise는 모든 유닛이 활성화되는 것은 아니며 실제로는 13~14개의 그룹핑만 있을 수 있다고 주장한다. SMX 장치의 실제 CUDA 코어는 2496 또는 2688입니다.

비디오 메모리 비트폭은 384비트로 황런순(Huang Renxun)과 엔비디아 CTO가 확인한 바 있다. 이전 보고보다 CUDA 코어 수가 적었기 때문에 메모리 비트 폭이 384bit로 감소하는 것은 당연합니다. GK104의 6Gbps 메모리 속도가 유지된다면 GK110의 대역폭은 288GB/s에 도달하여 마침내 384bit를 초과하게 됩니다. 260GB/s의 AMD GCN 아키텍처.

NVIDIA가 제공하는 3배의 배정밀도 부동 소수점 성능이 GF110 그래픽 카드와 비교되는지, 아니면 GF110 코어가 탑재된 Tesla 가속기 카드와 비교되는지 모르겠습니다. GF110의 정밀도는 1.58TFLOPS인 단정밀도의 1/4인 0.4TFLOPS이지만, GF110 코어 Tesla 카드의 이중 정밀도 기능은 단정밀도의 1/2인 약 0.8TFLOPS에 도달할 수 있습니다.

이렇게 그래픽 카드를 기반으로 한다면 GK110의 배정밀도 부동소수점 성능은 테슬라 카드의 3배 정도라면 약 1.2TFLOPS 이상이다. 후자가 이전 버전을 넘어섰다는 점을 고려하면, 소문에 따르면 2TFLOPS 성능에 따르면 GK110의 배정밀도 부동 소수점 성능은 1.2TFLOPS 이상이어야 합니다.