※ 2015년 8월 5일 오전 1시 최초 발행, 동일 오후 1시 비공개 전환, 동일 오후 9시 재발행

 

Author : Daeguen Lee

(Any action violating either copyright laws or CCL policy of the original source is strictly prohibited)

(이곳과 ITCM 연재본은 동시에 원본으로서의 효력이 있습니다. 출처 표기시 반드시 병기 바랍니다 : http://iyd.kr/758 & http://itcm.co.kr/review/320879)

 

 

 

안녕하세요 IYD / ITCM 독자 여러분, 그리고 국방의 의무를 위해 힘쓰고 계신 군 인트라넷 IT정보게시판 유저 여러분. 거의 월간지급의 연재주기로 불시에 글을 투척하고 오랜 기간 잠적하기를 밥먹듯 하는 제가 오늘, 여러분 앞에 새 글을 들고 나타났습니다.

 

제가 달필이 아니라 글 하나를 완성하는 데 보기보다 긴 시간이 들어 많은 글을 양산하지 못하는데다, 마음 내켜 자발적으로 쓸 글이 아니면 잘 써내려가지도 못하는 관계로 자연히 이곳에 채워지는 글이나 리뷰의 면면 역시 특정한 제품을 다루는 것이라기보다는 일반적이고, 큰 담론을 다루는 주제인 경우가 많습니다. 얼마 전의 크로스파이어 대 SLI 벤치마크가 그랬고, 매월 연재하고 있는 GAMER'S CHOICE가 그러한 예입니다. 아시겠지만 GAMER'S CHOICE의 전신인 '당신이 놓쳐온 것들' 은 최초 용산 총판들이 취급하는 (상품코드별 지도가가 매겨지는) 모든, 문자그대로 모든 그래픽카드를 대상으로 하는 것이었고 당시 준비 기간만 두 달에 다룬 그래픽카드만 400여 종에 달했었습니다. (심지어 첫 달에 이 모든 걸 다 해치운 것도 아니고, 연재를 시작하고 석 달째 들어서야 모든 400여 종을 커버하게 되었으니 사실상 다섯 달 어치의 프로젝트였던 셈입니다.)

 

물론, 제가 특정한 제품에 포커스를 맞춘 리뷰를 전혀 안 하는 건 아닙니다. 오히려 어떤 제품이든 새로 출시되면 반드시 다뤄 독자 여러분께 새로운 정보를 제공해드리기 위해 늘 촉각을 곤두세우고 있습니다. 단지 한번 다룬 제품을 웬만해서는 다시 돌아보지 않을 따름입니다. 예를 들어 엔비디아가 지포스 GTX 980 Ti를 출시한다면 당연히 그 엠바고에 맞춰 리뷰를 진행하(도록 노력하)지만, 정식 출시 이후 (=리뷰 등록 이후) ASUS의, 이엠텍의, MSI의 GTX 980 Ti가 줄줄이 출시된들 이들 각각을 다시 리뷰하지는 않는다는 뜻입니다.

 

즉 원칙적으로 제가 제품을 다루는 방침은 다음과 같습니다 : CPU는 아키텍처 단위, 그래픽카드는 모델넘버 단위로 최초 출시 당시 1회에 한해 리뷰 진행.

 

이쯤 되면 제가 무슨 제품을 소개하려고 이렇게 생색을 내나 싶으시죠. 뒤이어 보시면 아시겠지만 오늘의 주인공은, 아니 주인공들은, 이런 거창한 소개가 감히 어울리는 녀석들이라 장담할 수 있습니다. 틱-톡 주기로 매년 신제품을 시장에 공급하던 그 잘난 인텔이, 한번 스텝이 꼬여 헛발질(하스웰 리프레시)로 일년을 더 허비한 뒤인 바로 오늘, 전작으로부터 만 2년만에 정식으로 출시한 새로운 CPU이기 때문입니다. 바로 브로드웰과 스카이레이크입니다.

 

 

이들의 공식적인 풀 네임은 "인텔 5세대 / 6세대 코어 프로세서" 입니다. 원래 인텔의 틱-톡 주기가 맞아떨어졌다면, 2013년의 하스웰에 이어 2014년에 브로드웰이 그 자리를 대체하고 오늘은 스카이레이크의 독무대가 되어야 맞지만 브로드웰의 양산이 1년 가량 늦어지며 '5세대 코어 프로세서' 와 '6세대 코어 프로세서'가 엇비슷한 시기에 시장에 공존하는 형태가 되었습니다. 물론 인텔이 아무런 고려 없이 이러한 동시 출격을 명하진 않았겠죠. 지금부터 간략히 코어 프로세서 제품군의 역사를 되짚어보며 브로드웰과 스카이레이크 공존의 의의 및 '어째서 공존이 가능한가' 를 살펴보도록 합시다. 우선 1세대 코어 프로세서의 탄생부터 봐야겠죠.

 

<목차>

 

1. 인텔 코어 프로세서의 진화

2. 테스트 준비

3. 테스트 결과 : (1) CPU 성능

4. 테스트 결과 : (2) 게임 성능

5. 결론 및 제언

 

 

1. 인텔 코어 프로세서의 진화


아래 그림은 '코어' 라는 브랜드명을 최초로 사용한 코어 마이크로아키텍처에서, '1세대 코어 프로세서'로 카운트되기 시작한 네할렘 아키텍처의 진화를 간단히 나타낸 것입니다.

(※ 이하 여섯 장의 그림은 지난 5월경 ASUS 코리아 오버클럭 간담회에서 제가 맡은 세션의 발표자료로 쓰였던 것입니다.)

 

 

위 그림에서 왼쪽이 코어, 오른쪽이 네할렘이란 사실은 그림 자체에도 이미 적혀 있으니 제가 굳이 한번 더 언급할 필요는 없을 것 같습니다. 코어 아키텍처 자체도 직전 아키텍처인 P6-펜티엄M이나 넷버스트와 비교하면 상전벽해 수준으로 달라진 부분이 많지만, 네할렘은 거기에 다시 한 번 중대한 구조적 변화를 가했습니다. 페치 버퍼 후단에 위치하던 루프 탐지기를 디코더 후단으로 이동한 것입니다.

 

페치 버퍼는 L1 캐시로부터 읽어들인 명령어를 보내 주는 장소이고, 이 명령어들은 디코더에서 '해석'되어 CPU가 내부적으로 처리할 수 있는 작은 단위의 명령어 (마이크로옵) 로 분절됩니다. 코어 아키텍처에서 루프 탐지기가 도입된 것은 자주 반복되는 구문을 페치 버퍼 이후 단계에 짱박아 둠으로써 조금이나마 작업시간을 단축할 수 있게 한 것인데, 네할렘은 이를 디코더 이후 단계로 옮김으로써 한 단계를 더 단축하게 한 것입니다. 당연히 반복구문을 처리할 때 더 높은 능률을 보일 수 있고, 전체적인 성능향상에 기여하게 됩니다.

 

이것 외에도 네할렘은 코어와 비교해 달라진 부분이 많지만, 엄밀히 말해 CPU 내부의 변화라기보다는 CPU 외부 -언코어- 에 해당하는 부분이 큰 폭으로 개선되었습니다. 일례로 메모리컨트롤러를 CPU와 한 다이 안에 탑재한 것이라든지, 캐시 계층을 한 단계 늘려 '공유 L3 캐시'를 메모리컨트롤러와 묶은 점 등을 들 수 있겠습니다. 이러한 개선점에 힘입어 네할렘은 코어를 큰 폭으로 개량했다는 호평을 받으며 시장에 성공적으로 안착했습니다.

 

네할렘 발표 후 2년이 지나, 다시 한번 '톡'의 시기가 찾아왔습니다. 샌디브릿지 아키텍처 ("인텔 2세대 코어 프로세서") 의 등장입니다.

 

 

샌디브릿지 아키텍처는 어떤 의미에서 코어 -> 네할렘의 변화보다도 더 많은 변화를 네할렘에 끼얹은 설계입니다. 우선 MMX, SSE 이래로 가장 큰 ISA 확장이라 평가받는 AVX 명령어 세트를 탑재한 최초의 프로세서란 점을 꼽을 수 있겠습니다. 또한 과거 넷버스트 아키텍처에 도입되었던 '트레이스 캐시'의 기본 방침을 '마이크로옵 캐시' 라는 이름으로 재도입했는데, 이로써 사실상 L0 캐시가 신설된 것과 마찬가지의 효과를 갖게 되었습니다. 간단히 말해 성능이 크게 올랐다는 얘기죠. 또한 백엔드 측면에서는 AVX 도입으로 인해 두 배 더 높은 부동소수점 스루풋을 갖게 되었고, 메모리 접근 유닛의 구성이 다양해져 보다 유연하게 로드 또는 스토어 명령어를 처리할 수 있게 되었습니다.

 

이런 복잡한 얘기를 들먹이지 않더라도, 여러분 중 많은 분들은 샌디브릿지가 가져다 준 충격을 생생히 기억하실 겁니다. 그 후 지금까지의 CPU 역사를 되짚어 보면 사실상 마지막이라고 표현해도 틀리지 않을 '격변' 을 가져온 장본인이니까요. 그러나 샌디브릿지 아키텍처의 가장 중요한 변경점은, 외려 성능에 직결되지 않는 부분에 있었습니다. 바로 아래 설명할 '링버스' 구조의 도입입니다.

 

 

네할렘까지 인텔이 자신들의 CPU 설계에 적용한 방식은 위 그림의 왼쪽과 같습니다. 모든 임의의 CPU 코어는 모든 임의의 캐시 슬라이스와 일대일로 접속되어야 합니다. 그 이유는 그렇게 해야만 (이론적으로) 모든 코어가 X 모든 캐시에 대해 동등한 레이턴시로 접근할 수 있기 때문입니다. 사실 발상 자체는 지극히 옳습니다만 위 그림에서 드러나듯 코어 갯수가 증가함에 따라 연결에 소요되는 복잡도가 지수함수적으로 증가하는 문제가 생깁니다. 이래서는 프로세서 제조에 소요되는 비용 역시 지수함수적으로 증가할 것이 뻔한데, 당장은 급하지 않더라도 무어의 법칙에 따라 역시 지수함수적으로 증가하게 될 코어 갯수를 생각하면 시급해 해결해야만 하는 과제였습니다. 이를 해결하기 위해 인텔이 도입한 것이, 위 그림의 오른쪽, '링버스' 구조입니다.

 

매우 직관적인 그림이라 따로 설명할 필요는 없을 것 같습니다. 모든 접점이 일대일로 연결되던 왼쪽과 달리, 서로간의 연결에 다소의 비대칭성을 감수하는 한이 있더라도 복잡도를 눈에 띄게 줄일 수 있는 장점이 크다고 판단해 도입되었을 것입니다. 실제로 링버스 구조로 개편한 뒤 출시된 샌디브릿지-EP (8코어), 아이비브릿지-EP (~12코어), 하스웰-EP (~18코어) 는 각각 지수함수적인 코어갯수 증가 추세를 보이고 있습니다.

 

인텔은 다시 샌디브릿지 아키텍처 기반으로 2년을 알차게 보냈습니다 (샌디브릿지 -> 아이비브릿지). 특히 아이비브릿지 ("인텔 3세대 코어 프로세서") 세대에 들어서는 22nm 핀펫 공정을 세계 최초로 도입하며 공정 자체로도 학계와 산업계의 많은 관심을 끈 한편, 그에 비례해 (그간 상대적으로 '톡'에 치우쳐 있던) 틱-톡 주기 중 '틱'의 비중이 커지기 시작했고, 아이비브릿지부터는 전통적인 틱-톡 역할구분을 다소 허물기까지에 이르게 됩니다. '톡'에서 CPU 아키텍처를 교체한다는 큰 전제에는 변함이 없지만 '틱'에서 단순히 기존 아키텍처를 미세화하는 데 그치는 것이 아니라 코어 이외의 구조를 적극적으로 변경하기 시작한 것입니다. 특히 내장 GPU가 크게 바뀝니다. (이로써 한동안은 CPU 아키텍처 교체 -> 내장 GPU 아키텍처 교체로 틱-톡을 설명하려는 시도 역시 있었습니다.)

 

이 글에서는 내장 GPU까지는 다루지 않는 것으로 하고, 어쨌든 샌디브릿지 이후의 아키텍처인 하스웰 마이크로아키텍처 ("인텔 4세대 코어 프로세서") 를 소개할 차례입니다.

 

 

사실 이제 와서야 평가할 수 있게 된 것이지만, 아이비브릿지에 비해 거의 눈에 띄는 향상이 없어 보이던 하스웰이야말로 '가장 임팩트 없는' 인텔의 신제품 가운데 하나가 아니었을까 하는 생각이 듭니다. 그렇지만 하스웰의 설계 자체가 아이비브릿지와 큰 차이가 없다고 여긴다면 엄청나게 큰 오산입니다. 오히려 '코어 마이크로아키텍처'로부터 아이비브릿지에 이르기까지 6년간의 변화를 합친 것보다 더 많은 변화가 가해진 것이 하스웰이기 때문입니다.

 

구체적으로, 하스웰은 인텔이 거의 6년만에 처음으로 백엔드 포트 수를 늘린 아키텍처입니다. 비록 이에 상응하는 프론트엔드의 확충이 이뤄지지 않아 실제 성능향상으로 연결된 정도는 미미했으나, 이론적으로 백엔드에 끊김 없이 마이크로옵을 공급해 줄 경우 늘어난 포트 갯수만큼의 성능향상을 이끌어낼 수 있고, 경우에 따라 아이비브릿지 대비 최대 33%까지의 연산성능 향상도 기대해봄직 했습니다. (물론 기대가 실현되는 시간보다 인텔의 틱-톡 주기가 더 빨라, 하스웰은 자신의 꿈이 이뤄지는 것을 보기도 전에 세대교체의 제물이 되고 말았습니다.)

 

 

위 표는 작년 연말의 글 <하스웰의 모든 것 : (1) 아키텍처편> 에서 발췌한 것으로, 현실적인 명령어 세트 최적화 시나리오 하에서 샌디브릿지/아이비브릿지/하스웰이 각각 전세대보다 향상되었을 성능을 계량해 본 것입니다. 표를 통해 알 수 있듯 하스웰은 아이비브릿지가 샌디브릿지보다 나아진 것보다는 소폭이나마 더 좋아졌지만, 샌디브릿지가 가져왔던 임팩트에는 크게 못 미치고 있습니다.

 

여기까지가 4세대 코어 프로세서, 하스웰까지에 대한 설명입니다. 위의 모든 설명을 하나로 요약하자면 아래와 같을 것입니다.

 

"성능향상폭이 세대를 거듭할수록 둔화되고 있다."

 

이러한 많은 이들의 우려를 불식할 만큼 인텔이 강력한 한 방을 준비했을지 슬슬 궁금해집니다. 그렇지만 준비한 설명은 마저 듣고 가야겠죠.

 

현재까지 정확히 알려진 정보는 없습니다만, 그간 여러 문헌의 추정으로 대략 밑그림이 그려진 스카이레이크 ("인텔 6세대 코어 프로세서") 의 구조입니다.

 

 

스카이레이크는 다른 모든 설명이 필요없습니다. 이거 하나면 충분합니다 : "프론트엔드 확장."

 

하스웰이 기껏 백엔드를 확장하고서도, 그에 상응하는 프론트엔드 개선이 없어 성능향상을 못 이뤘단 평을 받았는데, 그렇다면 논리적으로 스카이레이크는 큰 성능향상을 이뤄야 얘기가 되겠죠. 이제 거두절미하고, 이 명제가 맞는지 본격적으로 검증하는 시간을 갖도록 하겠습니다.

 

 

2. 테스트 준비


테스트에 사용한 시스템 사양은 아래 표와 같습니다. 변인통제를 위해 구성요소의 변동을 최소화했고, 플랫폼이 달라지는 (하스웰/브로드웰 <-> 스카이레이크) 경우라도 동일한 제조사의 동일 라인업 메인보드를 사용하는 등 변인을 최소화하기 위해 노력했습니다. 메모리 역시, 하스웰/브로드웰과 스카이레이크 플랫폼이 각각 DDR3 / DDR4로 다르지만 작동 속도와 CL값을 최대한 비슷하게 맞춰 테스트했습니다.

 

 

테스트 중, 공통의 그래픽카드로 지포스 GTX 980 Ti를 달고 게임 성능을 측정했는데 이때 사용한 게임 타이틀과 그래픽 품질 설정은 아래 표와 같습니다. 대원칙은 모든 게임을 "설정 가능한 최상위 품질" 로 돌리는 것이고, 다만 그래픽 성능의 본질에서 벗어날 우려가 있는 안티알리아싱, 피직스 등의 옵션은 선택적으로 비활성화 하였습니다. 다만 특정 게임의 그래픽 품질 프리셋(preset)이 일정 수준의 안티알리아싱 옵션과 불가분의 관계에 있는 경우(예 : 최상위 프리셋과 차상위 프리셋의 차이가 오직 안티알리아싱뿐인 경우 등)는 예외적으로 안티알리아싱 옵션을 비활성화하지 않았습니다.

 

 

본 리뷰는 총 2부로 구성되며, 1부에 해당하는 이 글에서는 브로드웰/스카이레이크의 CPU 성능 및 (공통된 별도의 그래픽카드를 달고 측정한) 게임성능에 관해 다루고, 2부에서는 각각의 내장그래픽 게임성능 및 소비전력, 간단한 오버클럭 수율과 소감에 관해 다룰 것입니다. 두 편으로 쪼갠 건 딱히 특별한 이유가 있어서는 아니고, 스카이레이크 내장그래픽이 현재 테스트한 메인보드에서 출력되지 않아서 (...) 개선된 바이오스를 요청해 두었기 때문입니다. 뒤에서도 다루겠지만 2년만에 새로 도입되는 플랫폼인 만큼 초기 안정화가 조금 더 필요해 보이는 대목입니다.

 

아래는 오늘의 비교 대상인 CPU들입니다. 왼쪽부터 차례로 코어 i7 4790K, i7 5775C, i7 6700K 입니다.

 

 

일단 위 스샷으로 간단히 알 수 있는 차이점은 (클럭/이름/전압 이런것 제외) 스카이레이크의 L2 캐시 집합 연관성 관리방식이 이전의 둘과 달라졌다는 점입니다(하스웰/브로드웰은 8-way이지만 스카이레이크는 4-way). 또한 브로드웰의 L3 캐시 용량은 다른 둘보다 4분의 1가량 적은 6MB란 점도 알 수 있네요.

 

위 스샷에는 나타나 있지 않지만 브로드웰의 경우 내장 GPU와 공유하는 L4 캐시 역할의 128MB eDRAM이 CPU와 근거리에 탑재되어 있습니다. 이로 인해 대용량 캐시가 필요한 환경에서 이득을 볼 수 있겠고, 반대로 (용량과는 별로 관계없고) 고속의 캐시가 필요한 경우라면 L3 캐시 용량이 적은 것 때문에 다소간 손해를 볼 것이라고도 생각해볼 수 있습니다. 사실 말을 되게 그럴듯하게 했는데, 일반적인 테스트 환경을 보고 '이것은 캐시 용량을 중시할 것이다' / '이것은 용량보다 속도가 중요할 것이다' 라는 판단을 하기란 매우 어렵고, 따라서 이 글에서는 선제적인 분석보다는 결과를 두고 '이런 결과가 나온 것을 보니 이건 분명 이런 특성이었을 것이다' 식의, 끼워맞추기 분석으로 가도록 하겠습니다. 무식하면 용감하다고 하잖아요!

 

벤치마크 결과를 살펴보기 전에 테스트에 사용된 제품들 사진을 간단히 보고 갑시다.

 

 

오늘의 주인공들인 코어 i7 4790K, i7 6700K, 그리고 이들을 보좌할 메인보드들입니다. (※ 보유 중인 i7 5775C는 엔지니어링 샘플이기 때문에 박스가 없습니다.)

 

 

 

코어 i7 6700K의 박스는 위와 같이 생겼습니다. 쿨러가 없다는 사실을 명심해야겠고, 박스 디자인 자체가 전세대보다 화려하고 예뻐진 느낌이 듭니다.

 

 

한자리에 모아 본 시스템 구성 필수요소들 : CPU, 메인보드, 메모리. 이렇게 보니 꽤 단촐하죠?

 

 

우선 LGA1150 플랫폼부터 조립해 봅시다. ASUS의 MAXIMUS VII GENE 메인보드와 KLEVV Neo DDR3 메모리를 사용했습니다. 하스웰과 브로드웰에 공통적으로 사용된 조합입니다.

 

 

 

 

 

완성샷. 빙빙 돌려 가며 여러장 찍었습니다.

 

다음은 스카이레이크를 지원하는 LGA1151 시스템 차례입니다.

 

 

준비물은 코어 i7 6700K와 ASUS MAXIMUS VIII GENE 메인보드, KLEVV Cras DDR4 메모리입니다. 6세대 코어 프로세서는 K버전의 경우 쿨러가 동봉되어 있지 않습니다. 이 점 참고하셔야겠죠.

 

 

마침 굴러다니는 써모랩 트리니티가 있어 간단히 조립을 마치고...

 

 

 

어떻게 봐도 예쁜 KLEVV Cras 메모리 서비스샷 나갑니다.

 

 

 

역시 어떻게 봐도 예쁜 메인보드까지. 특히 이번에 바뀐 색 조합이 꽤나 예뻐보입니다. 슬슬 검빨에 질려가던 차에 시기적절한 변화가 아닌가 싶습니다.

 

 

 

위 사진을 통해, 하스웰과 브로드웰이 각각 동일한 핀 배치 및 소켓 규격 (래치의 위치) 을 가졌음을 알 수 있고, 반면 스카이레이크는 이들 둘과 다소 다르단 사실 역시 알 수 있습니다.

 

이것으로 사진 감상을 마치고, 본격적으로 그래프의 바다에 빠져 봅시다.

 

 

3. 테스트 결과 : (1) CPU 성능


이 장에서 살펴볼 것은 CPU 성능 테스트 결과입니다.

 

아래 두 장의 그래프는 산드라 2015의 'Processor Arithmetic' 및 'Processor Multi-Media' 항목을 테스트해 얻은 것입니다.

 

 

 

우선 둘 중 위의 그래프를 봅시다. 윗줄의 두 결과는 정수/부동소수점 스칼라 연산성능을 나타냅니다. 정수연산에서 스카이레이크는 동클럭의 하스웰/브로드웰을 앞지른데 이어 순정 상태에서의 비교에서도 하스웰을 앞서는 모습을 보여줍니다. 브로드웰의 경우 기본클럭 자체가 워낙 다른 둘보다 낮아 순정 비교에서는 맥을 못 추지만, 동클럭 통제 비교에서는 가까스로 하스웰보다 높은 점수를 얻을 수 있었습니다.

 

반면, 부동소수점 연산의 양상은 조금 다릅니다. 순정 비교시 브로드웰이 가장 떨어지는 점에는 변함이 없으나 이번에는 스카이레이크가 하스웰을 꺾는 데 실패했네요. 또한 동클럭 비교시에는 스카이레이크보다도 브로드웰이 유난히 높은 성능을 보이고 있습니다. 아무리 생각해도 브로드웰이 다른 둘보다 나을 껀덕지는 128MB L4 캐시밖에 없으니 제 해석을 밀어붙여 보겠습니다. 또한 스카이레이크는 하스웰보다 아주 소폭 개선된 동클럭 부동소수점 성능을 보이기는 했지만, 기본적으로 부동소수점 유닛이 늘어났다든지 하는 정도의 큰 변화는 없었다고 보는 편이 맞을 것 같습니다.

 

그런데 아랫줄의 두 결과를 보면 또 양상이 달라집니다. 이들은 각각 정수/부동소수점 벡터연산 성능을 나타내는데 어느 쪽이든 스카이레이크가 압도적으로 (+30~40%) 다른 둘을 앞서고 있으며, 브로드웰은 고용량 L4 캐시 탑재에도 불구하고 동클럭 성능이 하스웰보다 조금씩 떨어집니다. 상식적으로 브로드웰이 하스웰보다 못한 부분은 L3 캐시 용량뿐이니 그 쪽에서 발생한 핸디캡이 128MB L4 캐시로 채 치유되지 않은 것이라 믿어 보겠습니다.

 

아래의 테스트 결과는 3DMark 11 및 3DMark Fire Strike에서의 피직스 스코어(물리 점수)입니다.

 

 

여기에서도 -스카이레이크가 순정 기준 모든 대조군을 이기고 있으나- 브로드웰의 강세가 오히려 더 눈에 띕니다. (역시 L4 캐시빨 외에는 설명할 길이 없...)

 

다음의 그래프는 '렌더링' 에 관련된 테스트 결과를 한데 모아 본 것입니다. 좌측은 시네벤치, 우측은 POV-Ray 벤치마크입니다.

 

 

좌우 공통적으로 하스웰 -> 브로드웰 -> 스카이레이크 순으로 높아지는 동클럭 성능과, 브로드웰 -> 하스웰 -> 스카이레이크 순으로 높아지는 순정 성능을 보여주고 있습니다. 이 경우 브로드웰이 하스웰보다 더 높은 클럭당 성능을 보이는 것이 순수한 구조 개혁의 (아키텍처가 아주 소폭이라도 변경되었다면) 소산인지, L4 캐시의 영향인지는 불분명합니다. 확실한 것은 스카이레이크가 하스웰보다 8~12%가량 높은 IPC를 현실 속에서도 보여주고 있다는 점입니다.

 

다음은 체스의 수를 시뮬레이션하는 Fritz Chess Benchmark입니다.

 

 

위 그래프를 보면 하스웰과 브로드웰의 동클럭 성능에는 거의 차이가 없고, 스카이레이크가 이 둘을 근소한 -하지만 어느 정도 격차가 있는- 차이로 앞서는 모양입니다. 다만 순정 상태에서의 클럭 격차를 뒤집을 만큼까지는 아니어서, 순정 제품간의 비교를 보면 하스웰이 1위를 차지했고 스카이레이크가 그 뒤를 이어 2위를 차지했습니다.

 

다음은 핸드브레이크라는 인코딩 프로그램을 사용한 인코딩 성능 테스트입니다. 

 

 

여기에서는 스카이레이크가 하스웰보다 동클럭 기준 13%가량 높은 성능을 보이고, 순정 기준으로는 약 10%가량 높은 성능을 보이고 있습니다. 브로드웰은 기본 클럭 자체가 너무 낮다는 점만 빼면 비교적 무난한 동클럭 성능을 보이며 둘 사이에 자리잡고 있는 모습입니다.

 

다음은 암호화/복호화 및 압축/압축해제 벤치마크를 한데 모은 그래프입니다. 좌측은 TrueCrypt로 AES 알고리즘 벤치마크를 수행한 결과이고, 우측은 7-Zip에서 LZMA 알고리즘 벤치마크를 수행한 것입니다.

 

 

지금까지 봐 오던 결과와 모두 비슷하게 나타났습니다. 종합적으로, 스카이레이크는 하스웰/브로드웰보다 분명 향상된 IPC를 가졌으며, 비록 순정 클럭 기준으로 때로는 하스웰에 뒤처지기도, (그보다는 더 잦은 빈도로) 때로는 앞서기도 하지만 분명 한 단계 진보된 아키텍처란 점만큼은 부인할 수 없을 정도로 인상깊은 성능을 보여줬다고 생각합니다.

 

이를 보다 자세히 계량화하기 위해, 지금까지의 모든 CPU 벤치마크의 결과를 취합해 평균 상대성능값을 구해 보았습니다.

 

 

스카이레이크는 (=구체적으로, 코어 i7 6700K는) 하스웰 (=코어 i7 4790K) 보다 순정 상태에서 9%가량 더 빠른 종합 성능을 보였으며 동클럭 비교시에는 그 폭이 13% 가량으로 늘어납니다. 단순히 생각했을 때 10% 내외의 향상폭은 별것 아니라 치부할 수 있을지 모르나, 샌디브릿지 이후로 역대 어떤 아키텍처도 전세대 대비 두자릿수의 향상을 보이지 못했단 점을 생각하면 스카이레이크의 개선은 그들보다 더욱 명확한 것입니다.

 

CPU 외적인 요소가 많이 작용하는 '현실 세계에서의' 벤치마크를 제외하고, 연산성능 벤치마크에 한정해 개선폭을 살펴보면 이 점은 더욱 두드러집니다.

 

 

위 그래프에서, 동클럭 성능간의 비교를 살펴보면 브로드웰과 하스웰의 격차는 2%가 채 안 될 만큼 적습니다. 이 둘이 동일한 '하스웰' 마이크로아키텍처에 기반하고 있으니만큼 지극히 당연한 결과입니다. 반면 스카이레이크는 이 둘 모두보다 20%가량 향상된 IPC를 보이며, 3.6GHz라는 제한된 클럭으로 이미 순정 i7 4790K를 턱밑까지 추격하는 모습을 보여주고 있습니다.

 

지금까지 살펴본 결과를 요약하자면, 적어도 CPU 성능의 측면에서 스카이레이크는 실로 오랜만에 찾아온 '도약'의 세대라 평가할 수 있겠습니다.

 

그렇다면, 게임 성능은 어떠할까요. 바로 이어서 살펴보도록 하겠습니다.

 

 

4. 테스트 결과 : (2) 게임 성능


우선 게임 벤치마크에 빠지면 섭섭한 약방의 감초, 3D마크 결과입니다.

 

 

 

3D마크 11, 3D마크 파이어 스트라이크 모두 결과의 양상은 비슷합니다. 특이하게도 모든 테스트 항목에서 동클럭 성능의 경우 브로드웰이 다른 둘을 의미있는 격차로 이기는 것으로 나타났는데, 역시 이 현상을 설명할 것은 L4 캐시밖에는 없어 보입니다. (아, 참 편하군.) 스카이레이크는 브로드웰보다는 동클럭 성능이 떨어지지만 똑같이 L4 캐시가 없는 하스웰보다는 성능이 좋고, 순정 클럭이 적용된 경우 모든 항목에 걸쳐 다른 둘을 앞서는 결과를 보였습니다. 이제까지 살펴본 결과들에 비춰 보면 당연한 결과가 아닐까 싶네요.

 

이제 본격적으로 "실제" 게임성능 테스트 결과를 보여 드리도록 하겠습니다. 지면 관계상 게임 타이틀 3개씩을 묶어 하나의 그림으로 실었습니다. 아래는 에이리언 아이솔레이션 / 배틀필드 4 / 바이오쇼크 인피니트.

 

 

에이리언 시리즈는 원래 그래픽카드 외적인 요소의 영향을 잘 받지 않습니다. 얘는 논외로 두죠. 그런데 배틀필드 4와 바이오쇼크 인피니트의 결과 양상이 지금까지 살펴본 다른 결과 그래프들과는 판이하게 다릅니다. 이렇게 명확한 역주행 (스카이레이크 < 브로드웰 < 하스웰) 을 보이는 사례가 있었던가요?

 

게임벤치 초장부터 적잖이 당황스러워, 몇 번씩 보드를 번갈아 가며 테스트를 수 차례 재수행했으나 결과엔 변함이 없었습니다. 뭐, 플랫폼 초기 안정화가 안 된 사례가 없던 일은 아니니까요. 다른 게임에선 어떨까요.

 

다음은 크라이시스 3 / 더트 쇼다운 / 히트맨 앱솔루션입니다.

 

 

위 세개의 게임에서도 결과가 조금 이상한 양상으로 흘러갑니다. 크라이시스 3은 다들 오차범위 내에 있으니 논외로 하고, 더트에서는 스카이레이크만 홀로 뒤처진 클럭당 성능을 보여주고 있으며, 히트맨에서는 희한하게 브로드웰만 저만치 앞서가는 결과를 보여주고 있습니다. L4 캐시 덕분일거라 생각해 보더라도 이 정도면 이상한데, 역시 수 차례 테스트를 재수행했으나 결과엔 변화가 없었습니다.

 

다음은 메트로 2033 / 메트로 라스트 라이트 / 미들 어스 쉐도우 오브 모르도르입니다.

 

 

스카이레이크의 약세 / 브로드웰의 이상한 강세는 이제 더 이상 신기해 보이지 않게 되었습니다. 이번에도 마찬가지로 나타났거든요.

 

다음은 슬리핑 독스 / 스나이퍼 엘리트 / 씨프입니다.

 

 

여기에서도 마찬가지 결과입니다. 특히 씨프는 스카이레이크의 약세와 브로드웰의 강세를 동시에, 아주 극명히 보여주고 있습니다.

 

게임벤치 결과가 너무나 예상 밖이라 결과를 정리하는 내내 당황스러움을 금할 수 없었습니다. 어쨌든 결과 분석은 해 봐야겠죠. 12종 게임 누적 프레임레이트입니다.

 

 

순정 상태에서 i7 4790K가 가장 좋은 것은 말할 것도 없고, 모두 같은 클럭일 경우 브로드웰이 가장 좋은 게임성능을 발휘한다는 사실은 그간의 짐작을 벗어나도 한참 벗어나는 것입니다.

 

이거 본격 브로드웰 재평가 리뷰? -_-

 

다음은 보다 정밀하게, 12종 게임 및 3D마크 결과에 대해 i7 4790K를 기준으로 한 평균 상대성능을 구한 그래프입니다.

 

 

앞서 CPU 성능 벤치마크 결과를 총정리하며 '스카이레이크 3.6GHz가 i7 4790K에 맞먹는다' 는 말로 스카이레이크를 칭찬했는데 지금은 그 말을 브로드웰에게 돌려줘야 할 것 같습니다. 3.6GHz로 고정된 브로드웰은 동클럭의 다른 두 경쟁자보다 성능이 좋은 것은 물론, 기본 속도의 i7 4790K와 겨우 1%의 차이만 두고 있을 뿐입니다. 이들 모두를 동일한 클럭으로 오버클럭한다면 브로드웰이 가장 좋은 게임머신이 될 것입니다.

 

다만, 결과 자체의 명백한 트렌드와 별개로 이들 결과를 "어디까지 믿어야 하는가" 에 대해서 좀 더 고찰해 볼 필요가 있습니다. 일단 브로드웰 홀로 (L4 캐시빨로?) 좋은 결과를 보인 까닭에 스카이레이크가 '상대적으로' 뒤처진 게임들 말고, 아주 명백하게 스카이레이크 홀로 '나쁘게' 나온 게임들을 꼽자면 다음의 4개 타이틀이 해당됩니다 : 배틀필드 4, 바이오쇼크 인피니트, 더트 쇼다운, 슬리핑 독스 - 그리고 이들은 모두 이미 100여 프레임을 훌쩍 넘는 결과값을 갖는단 공통점이 있습니다.

 

다시 말해 스카이레이크가 유난히 떨어지는 성능을 보이던 타이틀에서 각 CPU가 기록한 결과값은 해당 게임을 더 or 덜 원활하게 구동하는 여부와는 이미 별개의 문제인데다, 이 결과는 오히려 "스카이레이크의 게임성능이 나쁘다" 는 결론보다 "FHD에서의 벤치마크 결과는 더이상 하이엔드 시스템의 성능지표로 삼기 부적합하다" 는 결론으로 받아들여질 수 있다는 얘기입니다. 프레임레이트가 높다는 것은 그만큼 프레임타임이 짧다는 것이고 저해상도에서 그래픽카드의 프레임타임 기여율이 낮아질수록 그래픽카드 외적인 부분의 기여율은 상대적으로 커진다는 뜻인데, 우리가 정작 중요하게 보아야 할 부분은 (CPU가 잘 보좌해서 이끌어내야 할) "그래픽카드의 기여율" 부분이지 다른 어떤 변수든 끼어들 수 있는 "그 밖의" 부분이 아니기 때문입니다. (예컨대 LGA1151 플랫폼 자체가 아직 안정화가 덜 되어 불가피한 레이턴시가 발생하는 경우 실상 "그래픽 성능"에 큰 영향을 주지 않는 요소이더라도 저해상도에서 그래픽 성능 자체의 기여율이 하락하며 "그 밖"의 일부로써 과장될 소지가 있다는 얘기입니다.)

 

 

(※ 위 그림은 <왕좌의 게임 : GTX 980 Ti vs GTX TITAN X> 에서 발췌한 것입니다. 오른쪽에서 왼쪽으로 이동하면서 보면 해상도가 낮아질수록 '프레임타임'을 구성하는 데 있어 VGA 외적인 요소의 비중이 커짐을 관찰할 수 있습니다. 당시는 VGA 리뷰였기에 편의상 VGA 이외의 부분을 모두 CPU로 퉁쳤지만, 기실 CPU의 역할은 VGA를 보좌해 병목 없이 본연의 성능을 끌어내 주는 것이지 "VGA 이외" 모든 여집합에 관여하는 것은 아닙니다.)

 

예를 들어, 이미 100프레임을 훌쩍 넘는 게임에서 열세이던 스카이레이크가 50~60프레임 경계선상에 놓인 게임에서는 다른 경쟁자를 유의미하게 이길 수 있다면, 그리고 그럼에도 불구하고 총 평균에서 다른 경쟁자들에 뒤진다면 과연 그것만으로 스카이레이크를 "게임용으로 부적합한 CPU" 단정짓는 게 합당하다고는 할 수 없을 것입니다. 게다가 하스웰을 기준으로 브로드웰과 스카이레이크의 동클럭 게임성능 편차는 채 ±5% 범위를 넘지 않습니다. 종합적으로 보아 게임 성능이 "유의미할 정도로 나쁘다" 라기보다는 "별 차이가 없다", 내지는 "(아직까지는) 나쁘다" 정도로 유보적인 결론을 내는 것이 더 합리적이지 않을까 싶습니다.

 

 

5. 결론 및 제언


지금까지 살펴본 내용을 정리해 봅시다.

 

스카이레이크는 CPU 성능만 놓고 볼 때 하스웰 대비 13%가량 향상된 IPC를 가졌으며, 특히 연산성능에 국한할 경우 하스웰 대비 IPC 개선폭은 20%까지 증가합니다. 이것만으로도 최근 몇 세대 이래 가장 큰 변화를 가져온 '톡'이라 평가받기 부족함이 없지만, 그러나 게임성능은 이상스러울 만큼 낮아진 모습을 보였는데 개인적인 생각으로는 신규 플랫폼 도입 초기라는 특성과 맞물려 '제 성능이 다 못 발휘되는' 상황이 아닐까 짐작하고 있습니다. 어쨌든 현재의 미흡함은 있는 그대로 인정해야겠고, 이 대목에서 우리는 브로드웰을 다시 한번 돌아볼 필요가 있습니다.

 

브로드웰은 데스크탑 최상위모델치고 상당히 낮은 기본클럭 (3.3GHz) 을 갖고 있어 '있는 그대로' 사용한다면 i7 4790K나 i7 6700K와 대등히 경쟁하는 것 자체가 쉽지 않습니다. 실제로 이 글에서 지금까지 다룬 많은 벤치마크에서 그러한 모습을 보여준 바 있습니다. 그러나 한편으로 다른 두 제품이 갖지 못한 장점도 있으니, 내장 GPU와 공유하게끔 설계된 128MB eDRAM L4 캐시가 그것입니다. 이 특징이 장점으로 발휘된 벤치마크보다 그렇지 않은 벤치마크가 더 많았습니다만 게임 벤치마크에서는 상당히 위력을 발휘한 것이 사실이고, 또한 스카이레이크가 약세를 보인 항목과 L4 캐시가 강세를 보인 항목이 우연찮게 겹치는 경우가 많았기에 관점에 따라서는 스카이레이크와 서로 상보적인 관계를 유지하며 각자 필요한 사용자층을 공략하는 것도 가능하리라 생각합니다.

 

 

마지막으로, 스카이레이크의 낮은 게임성능에 충격을 받았을지 모르는 독자의 심신 안정을 위해 고대의 자료 몇 개를 발췌해 봤습니다. 바로 네할렘 출시 직후, 지금과 마찬가지로 "게임성능이 코어 2 쿼드보다 떨어진다" 는 클레임이 심심찮게 쏟아지던 시절의 증거 자료들입니다.

 

 

 

이렇듯 늘 대격변을 거친 신 아키텍처가 도입되는 시기엔 기존의 프로그램과의 불화가 늘 있어왔던 것 같습니다. 워낙 오래 전 일이라 네할렘이 이 이슈에 어떻게 -적극적으로- 대처했는지는 잘 기억나지 않지만, CPU만큼이나 빠른 속도로 진화하는 것이 그래픽카드 시장이고, 그래픽카드 성능이 이미 네할렘의 출시 당시보다 훨씬 높아지게 되고 & 그만한 그래픽카드 성능을 요구하는 게임 타이틀이 끊임없이 등장하면서, 네할렘은 머지 않아 자신을 제외한 다른 CPU로는 도저히 '발목 안 잡고 성능을 뽑아줄 수 없는' 고성능 그래픽카드의 러닝메이트로 독보적인 인기를 누리게 되었습니다. 스카이레이크 역시 비슷한 전철을 밟지 않을까 조심스레 기대하는 입장입니다. 마침 지금의 그래픽카드 시장은, 윈도우 10과 다이렉트X 12의 보급과 맞물려 한바탕 격변이 일어날 조짐을 뭉게뭉게 풍기고도 있지 않습니까.

 

결국은 요 근래 리뷰하는 거의 모든 제품마다 비슷한 멘트로 마무리하게 되는 것 같네요. 스카이레이크 역시 다분히 미래지향적인 제품이라는 인상을 받았음을 숨기지 않겠습니다.

 

그간 하스웰-스카이레이크 사이의 징검다리처럼만 여겨져 국내/외 어디서도 그리 심도있게 다루지 않았고, 다루더라도 내장그래픽 성능에 국한해 다뤄지곤 했던 브로드웰의 '데스크탑용 메인 프로세서로써의' 가능성을 발굴한 것이 개인적으로 이 글의 가장 큰 소득이었다고 생각합니다. 조만간 등록될 2부에서는 내장그래픽 성능을 다룰 예정인데, 여기에서도 브로드웰의 활약을 기대해 주시기 바랍니다.

 

이 글 전체를 관통하는 제 소감을 한 줄로 요약하자면 이것일 것 같습니다 : "괜히 동시에 출격시킨게 아니구나."

 

긴 글 읽어주셔서 감사합니다 :)

 

 

 

 

저작자 표시 비영리 동일 조건 변경 허락
신고