Author : Daeguen Lee

(Any action violating either CCL policy or copyright laws is strictly prohibited)

 

 

 

지난달 중순, 아래 글을 통해 엔비디아가 맥스웰 아키텍처를 도입하며 이뤄 낸 성과를 계량화하려는 시도를 한 바 있는데, 마침 엔비디아의 공식 발표자료를 통해 예측이 거의 정확했음이 증명된 바 있습니다. (이하 아래 스샷 참조) 그리고 오늘 오전 드디어 공개된 2세대 맥스웰 (GM204) 기반 지포스 GTX 980/970의 성능 역시 당초 예상했던 바와 일치하게 들어맞는 결과임을 확인할 수 있었습니다.

 

▶ 2세대 맥스웰 (GM204) 성능 예측 - http://iyd.kr/668

 

 

 

참고로 오늘 오전 정확히 공개된 스펙을 바탕으로 계산된 GTX 970의 성능은 다음과 같습니다.

 

 

 

보시다시피, 300달러 중반대에 불과한 가격의 GTX 970이 GTX 780/780 Ti 사이의 성능을 보일 것으로 계산됩니다. 실제로 GTX 980/970의 뛰어난 가전성비가 사용자들의 대단히 우호적인 반응을 이끌어내고 있는 가운데 엔비디아는 이미 이들의 동생 격인 GTX 960이 다음달 중에, 그것도 300달러 미만의 가격으로 출시될 것임을 공언한 바 있습니다. 정황상 28nm 공정의 2세대 맥스웰 칩인 GM204가 사용될 것으로 예상되며 그 스펙은 어떻게든 GTX 970보다 낮게끔 하향될 것이기에, 가능성이 높아 보이는 몇 가지 시나리오를 바탕으로 GTX 960의 예상 성능을 점쳐보고자 합니다. 아래는 제가 가정한 시나리오입니다.

 

 

1. 12SMM + full ROP/IMC

첫번째 시나리오는 GTX 970에서 SMM 한 개만 줄어들었다는 가정입니다. GTX 970이 13개의 SMM으로 구성되니 이 시나리오 하의 GTX 960은 12개의 SMM 및 완전무결한 ROP/메모리 인터페이스를 갖게 됩니다. 즉 이 때의 스펙은 아래와 같습니다.

 

GTX 960 (Scenario 1) : 1,536 CUDA Cores / 96 TMUs / 64 ROPs / 256bit GDDR5

 

그리고 이 때의 예상 성능은 아래와 같습니다. GTX 780에 약간 못 미치지만, 거의 근접한 성능입니다.

 

 

 

2. 10SMM + full ROP/IMC

두번째 시나리오는 GTX 970에서 3개의 SMM이 줄어드는 경우입니다. 이 때의 스펙은 아래와 같고, 성능은 아래 그림과 같습니다. GTX 780과 680의 한가운데...... 보다는 미세하게나마 GTX 780에 더 가까운 성능을 보일 것으로 예상됩니다. (GTX 780/770 사이의 성능이라고 생각하면 될 것 같습니다)

 

GTX 960 (Scenario 2) : 1,280 CUDA Cores / 80 TMUs / 64 ROPs / 256bit GDDR5

 

 

 

3. 13SMM + 3/4 ROP/IMC

세번째 시나리오는 앞의 두 시나리오와는 달리, GTX 970과 동일한 SMM 갯수를 가지나 ROP/메모리 인터페이스가 25% 삭감되는 경우입니다. 과거 GTX 670으로부터 파생된 GTX 660 Ti의 관계와 동일합니다. 이 때의 스펙은 아래와 같습니다. 이 시나리오 하에서 GTX 960은, 앞의 시나리오보다 SP/TMU 갯수가 더 많음에도 불구하고 성능은 5%p 가량 더 떨어져 GTX 770에 더 가까운 성능을 보일 것으로 예상됩니다. (여전히 GTX 780/770 사이에 위치하기는 합니다)

 

GTX 960 (Scenario 3) : 1,664 CUDA Cores / 104 TMUs / 48 ROPs / 192bit GDDR5

 

 

 

4. 10SMM + 3/4 ROP/IMC

마지막 시나리오는 가장 비관적인(?) 버전입니다. GTX 970 대비 SMM 갯수도 3개가 줄어들고, ROP/메모리 인터페이스도 25% 하향된 경우인데 이 때의 스펙 및 예상 성능은 아래와 같습니다. 보시다시피 GTX 680과 동급으로까지 성능이 낮아진 것을 볼 수 있습니다. x60 라인업끼리만 비교하자면 분명 GTX 760보다 성능이 오른 것이기는 합니다만... 별로 매력적으로 보이지는 않는군요.

 

GTX 960 (Scenario 4) : 1,280 CUDA Cores / 80 TMUs / 48 ROPs / 192bit GDDR5

 

 

 

이상입니다. 긴 글 읽어주셔서 감사합니다. :-)

 

//

 

(아래 위젯은 티스토리의 크라우드펀딩 시스템인 '밀어주기' 위젯입니다. 100원부터 3000원까지의 범위 내에서 글쓴이에게 소액 기부가 가능합니다. 사견으로는 이러한 형태의 펀딩이야말로, 성공적으로 정착될 경우 이해관계자로부터 독립된 벤치마크가 지속가능해지는 원동력이 될 것이라 생각합니다. 제가 작성한 글이 후원할만한 가치가 있다고 여기신다면 밀어주기를 통한 후원을 부탁드립니다. 물론 글을 '가치있게' 쓰는 것은 오롯이 저의 몫이며, 설령 제 글이 '후원할 만큼 가치있게' 여겨지지는 못해 결과적으로 후원을 받지 못하더라도 그것이 독자 여러분의 잘못이 아니란 건 너무 당연해 굳이 언급할 필요도 없겠습니다. 저는 후원 여부와 관계없이 제 글을 읽어주시는 모든 독자분께 감사합니다.)

 

 

저작자 표시 비영리 동일 조건 변경 허락