고성능 PC의 조건은 무엇일까? 예나 지금이나 고성능 PC를 대변하는 것은 바로 쾌적한 연산 속도에 있다 해도 과언은 아닐 것이다. 말 그대로 압도적인 ‘성능’으로 가치를 입증해야 한다는 이야기다. 요즘 '고성능 PC'는 복합적인 의미가 되었지만, 과거 '고성능 PC'라고 하면 ‘프로세서’(CPU)의 성능으로 모든 것을 이야기하던 시기였다. 때문에 비중은 줄어들었어도 프로세서의 가치는 여전히 유효하다.

 

이제 우리는 다중코어 프로세서를 쉽게 접한다. 듀얼코어나 쿼드코어는 이제 무덤덤하고 비용만 좀 더 지불하면 헥사나 옥타코어 정도는 어렵지 않게 구할 수 있다. 프로세서의 코어가 늘어나면서 우리가 실행하는 작업 프로세스에도 많은 변화가 있었다. 하나의 코어를 활용하는 것을 넘어 이제 여러 코어를 한 번에 활용하는 구조가 된 것이다. 하나의 작업을 하더라도 1분 1초 더 단축되어야 하고, 여러 작업을 동시에 수행하더라도 지치지 않는 성능을 요구한다. 

 

까다로운 조건이지만, 인텔은 이런 시장의 요구에 맞춘 프로세서 라인업을 갖추고 있었다. 코어 하이엔드 데스크톱 프로세서 라인업이 그것이다. 최근까지만 하더라도 이 프로세서는 최대 10개에 달하는 코어를 제공, 시간이 곧 돈인 환경에서 효자 노릇을 단단히 해 왔다. 그러나 멀티태스킹(Multi-Tasking)을 넘어 메가태스킹(Mega-Tasking)을 처리해야 하는 현재의 컴퓨팅 환경에서는 그 이상의 프로세서를 준비하지 않으면 안 되는 상황이 되었다.

 

이에 인텔은 과감하게 프로세서 라인업을 재정비해 메가태스킹 환경에 대응하기 시작했다. 그 결과물이 바로 코어 X-시리즈다. 최대 18개에 달하는 코어를 제공하는 새 프로세서 라인업은 급변하는 컴퓨팅 환경에 대한 인텔의 대답이자 선물이기도 하다. 그렇다면 그 성능은 어느 정도일까? 코어 X-시리즈 끝판왕이라 불리는 코어 i9 7980XE 익스트림 에디션을 통해 알아보자.

 

 

코어 i9 X-시리즈... 넌 무엇이니?

 

 

지난 2017년 6월, 대만에서 열린 컴퓨텍스(COMPUTEX) 2017에서 인텔은 새로운 프로세서 라인업을 공개한다. 그 이름은 바로 코어 X-시리즈(Core X-Series) 프로세서. 그동안 인텔 데스크탑 프로세서를 이끌어 오던 하이엔드 데스크톱(HEDT) 프로세서의 이름을 새로 명명하게 된 것이다. 새 작명이 도입되기 이전에는 코어 i7 하이엔드 데스크톱 프로세서로, 제품명 뒤에 K와 X라는 이름을 붙여왔다. K는 익숙한 형태로 일반 코어 프로세서와 동일한 특징을 갖춘다. X는 익스트림 라인업으로 많은 코어를 탑재한 것을 강점으로 꼽았다.

 

하지만 코어 X-시리즈로 통일되면서 기존 K 라인업은 사라지게 되었다. 인텔은 모든 코어 X-시리즈 제품명 뒤에 X를 붙였기 때문이다. 그렇다면 익스트림 에디션이 사라지는 것 아닌가 하는 의문이 생길 수 있다. 결과적으로 익스트림 에디션은 사라지지 않았다. 대신 X에서 XE라는 이름으로 변경된 것이 다르다. 현재 코어 i9 7980XE가 기존 X 라인업의 명맥을 잇는 프로세서가 되었다. 아직까진 XE가 붙은 것은 i9 7980EX가 유일하다.

 

▲ 코어 i7 900X 시리즈 익스트림 프로세서. 코어 X-시리즈 프로세서의 조상 격 되시겠다

 

인텔 HEDT 프로세서의 역사를 살펴보면 코어 i7 980X로 거슬러 올라간다. 더 구세대에도 익스트림 라인업이 있었지만 HEDT 라인업이라고 보기엔 다른 점이 많았다. 그저 오버클럭이 더 잘 되는 고급형 제품이라고 보는 것이 맞다. 하지만 1세대 코어 프로세서부터는 플랫폼 구성에 변화를 주기 시작하면서 차별화를 꾀했다.

 

1세대 코어 프로세서, 코드명 린필드(Lynnfield)와 클락데일(Clarkdale)로 알려져 있는 라인업은 LGA 1151 소켓 기반의 플랫폼으로 시작했다. 그리고 이후 전개된 코어 i7 HEDT 플랫폼은 코드명 블룸필드(Bloomfield)로 코어 i7 900대 라인업으로 구성됐는데, 메인보드가 호환되지 않았다. 이쪽은 LGA 1366 소켓에 기반을 뒀기 때문이다.

 

플랫폼의 차이는 곧 성능의 차이로 이어지게 되었다. 코어 i7 800 시리즈로 대변되던 일반 고성능 데스크톱 프로세서 라인업은 듀얼채널 DDR3 메모리를 채용했지만, 코어 i7 900 시리즈는 트리플채널 DDR3 메모리 구조를 따랐다. 그만큼 더 많은 데이터를 쓰는 작업에 유리했다.

 

 

▲ 인텔 HEDT & 코어-X 프로세서 변천사. 우측으로 갈수록 최신 라인업이다

 

인텔은 블룸필드 이후 걸프타운(Gulftown)이라는 코드명을 가진 익스트림 프로세서 라인업을 본격적으로 추가했다. 코어 i7 980X가 대표적으로 6코어/12쓰레드 구조를 취했다. 출시 당시 데스크톱 프로세서로는 최고 사양으로 가격 또한 상당했다.

 

이를 시작으로 인텔은 HEDT 프로세서 라인업에도 세대교체를 꾸준히 이어나가기 시작했다. 흥미롭게도 2세대 HEDT 프로세서는 3000번대 이름을 물려받았다. 그리고 일반 코어 프로세서에 채용한 아키텍처를 쓰지 않고 그 이전 세대에 쓰인 서버 프로세서를 기반으로 다중코어 프로세서를 구성했다. 예로 3세대 코어 프로세서, 코드명 아이비브리지(Ivy Bridge)가 출시되던 시기에 인텔이 선보인 HEDT 프로세서는 2세대 코어 프로세서였던 코드명 샌디브리지(Sandy Bridge)에 기반한다.

 

이번에 출시한 코어 i9 7890XE도 마찬가지다. 코어 X-시리즈 프로세서는 2개의 아키텍처가 섞여 있지만 가장 핵심이 되는 HEDT 프로세서에는 이전 세대인 스카이레이크(Skylake)를 채택하고 있다. 그러니까 7세대와 같은 제품명을 쓰지만 HEDT 라인업으로 보면 6세대에 해당한다.

 

 

코어 i9 X-시리즈 넌 무엇이 달라졌니?

 

새로운 코어 X-시리즈는 기존 라인업과 많은 부분이 다르다. 그 변화는 플랫폼부터 아키텍처까지 대부분에 이른다. 코어의 수를 대폭 확장하면서 이뤄진 불가피한 조치다. 

 

우선 어디서부터 달라졌는지 알아보자. 먼저 플랫폼이다. 코어의 수가 증가하고 그에 따른 전압 및 데이터 통로의 변화에 따라 소켓 구성이 변경됐다. 코어 i7 3000X 시리즈부터 i7 6000X 시리즈까지 이어지던 LGA 2011 규격이 LGA 2066으로 확장됐다. 

 

▲ 코어 X-시리즈 프로세서의 다이 이미지. 캐시와 컨트롤러 등이 거의 일정하게 배치되어 있다.

 

면적이 넓어졌는데, 넓어진 면적은 대부분 코어 증설에 쓰인다. 물론 컨트롤러나 기타 명령어 추가를 위한 요소들도 포함되지만, 대규모 코어로 구성되는 플랫폼이기 때문에 코어가 대부분을 차지하고 있다 해도 이상하지 않을 정도. 하지만 중요한 것은 새로운 HEDT 프로세서는 기존과 다른 아키텍처를 적용했다는 점이다.

 

인텔은 코어 i7 6950X, 그러니까 브로드웰-E(Broadwell-E)까지 링버스(Ring-Bus) 형태의 설계를 채택해 성능을 높여왔다. 데이터 처리를 위한 모듈, 예로 코어와 캐시, 주요 컨트롤러들을 선형으로 배치해 효율을 확보해 온 것이다.

 

▲ 기존의 링버스(Ring Bus) 구조는 코어가 늘어날수록 효율이 저하된다

 

그러나 코어 수가 늘면서 링버스 구조로는 설계 효율이 낮아지는 문제를 낳았다. 각 부품이 모듈형으로 구성되는 까닭에 코어가 많아지면 덩달아 프로세서 다이가 비대해지고 설계 효율이 떨어지게 된다. 정해진 플랫폼으로 몇 세대를 이어가야 하는 HEDT 플랫폼의 입장에서 보면 불리한 구조인 셈이다. 인텔은 이를 극복하기 위해 메모리 대역폭이나 속도를 높이는 식의 처방을 이어갔지만 한계를 드러내는데 오랜 시간이 필요하지 않았다. 

 

▲ 코어를 각각 그물처럼 연결한 메시(Mesh) 구조

 

이에 인텔이 선택한 설계는 바로 각 코어와 컨트롤러를 그물처럼 엮는 메시(Mesh) 구조다. 다이를 블록 단위로 구성하고 그 블록 내에 컨트롤러와 코어, 캐시 등을 배치한다. 그리고 블록 사이에는 데이터들이 지나는 통로(라우터)와 통신을 위한 인터페이스를 배치해 그물처럼 통신하도록 만들었다. 직렬로 배치되기에 다중코어 설계 및 낮은 작동속도 내에서의 대역폭 확보에 유리하다.

 

 ▲ 인텔 코어 X-시리즈 프로세서는 X299 칩셋 메인보드들과 호흡을 맞춘다

 

설계가 바뀌고 코어 수가 극단적으로 증가하면서 자연스레 프로세서 다이가 커졌다. LGA 2066 소켓 규격을 채택한 이유가 여기에 있다. 동시에 이를 활용하기 위해 새로운 플랫폼을 제안했는데, 바로 X299 칩셋이다.

 

X299는 다양한 코어 X-시리즈 프로세서와 호흡을 맞추는 새 칩셋이다. 다른 인텔 데스크톱 플랫폼(인텔 200 시리즈)과 비슷하게 옵테인 메모리 기술이나 DMI 3.0에 기반한 대역폭(8GT/s) 등을 지원하고 있으며, 최신 프로세서 라인업답게 DDR4-2666 지원이나 다수의 확장 포트를 제공한다. 칩셋에서 별도로 최대 44개의 PCI-Express 3.0 레인을 제공하는 점도 특징이다.

 

하지만 프로세서 라인업에 따라 제공되는 PCI-Express 레인에 차이가 있음을 참고할 필요가 있다. 종류에 따라 적게는 16레인, 많게는 44레인까지 제공하는데, 코어 i9 이상 라인업들은 44레인을 제공하므로 다양한 장치를 활용할 가능성이 열리게 된다.

 

 

‘18코어/36쓰레드’의 위엄... 그 성능은?

 

▲ 이번 테스트를 위해 힘겹게 구한 코어 i9 7980XE. 아쉽게도 수냉쿨러 아래에 자태를 감추고 있다

 

코어 i9 7980XE 익스트림 에디션, 과연 18코어 36쓰레드의 성능은 소문만큼이나 판타스틱하고 원더풀할까? 확인하기 위해 테스트를 진행했다. 프로세서의 특성을 고려, 멀티코어를 활용한 인코팅이나 렌더링 위주의 벤치마크 소프트웨어를 실행했다. 차이를 확인하기 위해 비교 대상으로는 2세대 이전 코어 익스트림 프로세서, 코어 i7 5960X를 선택했다. 코어 i7 6950X와 비교해도 되지만 실질적인 교체 대상은 2~3세대 이전 익스트림 플랫폼이라고 판단했기 때문이다.

 

 

시스템 사양은 다음과 같다. 코어 i9 7980XE 익스트림 에디션 프로세서에는 에이수스 TUF X299 Mark I 메인보드와 지스킬 트라이던트Z DDR4-3200 32GB(8GB x 4), 240GB 용량의 SSD 및 이엠텍 지포스 GTX 1080 제트스트림 등과 호흡을 맞췄다. 비교 대상으로 채택한 코어 i7 5960X 익스트림 에디션은 에이수스 X99 디럭스 메인보드와 매칭했으며 나머지 구성은 동일하다.

 

벤치마크는 모든 항목 5회씩 측정했으며, 5회 측정 결과 가운데 가장 잘 나온 결과를 각각 채택했다.

 

▶ 인코딩 성능 비교 – Handbreak HEVC 4K

 

영상 인코딩 처리 성능을 확인하기 위해 비교적 많이 활용하는 소프트웨어, 핸드브레이크(Handbreak)를 사용했다. 4K HEVC 코덱을 활용해 영상 인코딩을 시도했으며 약 10분가량의 영상을 가지고 4K 영상 인코딩을 얼마나 자연스레 처리하는지 확인하는 데 초점을 맞췄다. 그래프 수치 단위는 초당 처리 프레임으로 높을수록 성능이 뛰어나다.

 

테스트 결과, 코어 i9 7980XE는 46.5 프레임으로 25.7프레임을 기록한 코어 i7 5960X 대비 2배 가까운 차이를 보여주는 것으로 나타났다. 더 많은 코어와 쓰레드 처리 수는 영상 작업 시 거의 실시간에 가까운 수준으로 확인할 수 있도록 도와준다. 결과적으로 i9 7980XE가 작업 처리 시간에서 2배가량 빠르기 때문에 영상 편집, 인코딩 시간에 민감한 환경이라면 작업 효율 향상에 큰 도움을 줄 것이다.

 


▶ 압축 성능 비교 – 7-Zip Benchmark

 

코어가 많을수록 압축 성능에 어느 정도 영향을 주는지 7-Zip Benchmark를 통해 확인해 보겠다. 이 테스트는 지속적으로 압축 용량을 변경하면서 성능을 측정하는데, 테스트가 약 50회 이상 지나면 종합 성능(평균)이 고정 표시된다. 수치가 고정되어 변화하지 않는 시기를 기준으로 두 프로세서를 비교했다. 단위는 MIPS(Million Instructions Per Second)로 높을수록 성능이 좋은 것이니 참고하자.

 

테스트 결과, 코어 i9 7980XE는 9만 60 MIPS로 4만 3083 MIPS를 기록한 코어 i7 5960X 대비 2배 이상 차이를 보여준다. 18코어 36쓰레드의 위엄을 여기에서도 고스란히 느낄 수 있다. 동작속도 역시 기본 2.6GHz라 하더라도 실제 테스트 구동 시에는 3.4GHz 가량이었다. 참고로 i9 7980XE의 올코어(모든 코어를 사용하는 작업 시) 부스트 클럭은 3.4GHz이며, 1~2 코어의 동작속도만 최대로 향상시키는 터보부스트는 4.2GHz다. 여기서는 모든 코어를 사용하는 작업이기 때문에 3.4GHz로 작동했다.

 

 

▶ 렌더링 성능 비교 – 블렌더

 

 

3D 이미지를 렌더링하는 소프트웨어 블렌더를 활용해 프로세서 간 성능을 비교했다. 방식은 블렌치마크(BlenchMark)의 데이터를 설치한 다음, 이를 실행해 최종 마무리된 시간을 비교하는 방식이다. 이미지는 정해진 차량의 이미지 데이터를 프로세서가 렌더링하는 것으로 동일한 것을 사용했다는 점 참고하자. 단위는 초(sec)로 그래프 수치가 낮을수록 성능이 좋은 것이다. (더 빨리 작업이 끝났으므로)

 

측정해 보니 코어 i9 7980XE는 40초 만에 이미지 렌더링 작업을 마무리했다. 79초 만에 이미지를 그려낸 코어 i7 5960X와 비교하면 약 2배 가까운 차이다. 8코어/16쓰레드, 18코어/36쓰레드 구성에 비하면 비례한 수준의 차이는 아니지만 충분히 제 능력을 발휘했다 봐도 무방해 보인다.

 

 

▶ 렌더링 성능 비교 – 코로나

 

이미지 렌더링 성능을 측정하는 코로나(Corona)를 활용해 두 프로세서를 비교해 봤다. 버전은 1.3을 사용했으며, 완전한 이미지 하나를 렌더링하는데 소요되는 시간을 측정했다. 앞선 벤치마크와 마찬가지로 동일한 소프트웨어를 5회 측정한 다음 가장 좋은 수치를 보여준 결과를 기준으로 비교했다. 단위는 초로 그래프가 낮을수록 성능이 뛰어남을 의미한다.

 

이번 테스트에서는 놀랄만한 차이가 나타났다. 코어 i9 7980XE는 57초가 가장 좋은 수치였다. 반면 코어 i7 5960X는 140초가 가장 빠른 수치였다. 2분 20초와 57초, 2.5배 이상 성능 차이를 보여준 것. 물리 코어와 이를 보조하는 논리 프로세서의 수가 많다면 그만큼 렌더링 작업에 이점을 안겨줄 수 있다는 것을 직접 보여주고 있다.

 

 

▶ 렌더링 성능 비교 – 럭스마크

 

이번에 진행한 렌더링 테스트는 럭스마크(Luxmark)로 프로세서와 그래픽 프로세서 등을 활용한 렌더링 성능을 확인하기에 좋은 소프트웨어다. 테스트는 처리 삼각형 수에 따라 3가지 항목을 제공하는데, 두 프로세서의 성능 차이를 최대한 확인해보고자 테스트 항목을 가장 복잡한 것(호텔)을 선택했다. 이 외에 C++ 명령어와 OpenCL 명령어를 프로세서가 처리할 때의 차이도 확인해 봤다. 단위는 자체 점수로 높을수록 성능이 뛰어나다.

 

먼저 순수 C++ 처리 시 얼마나 빠른 연산이 가능한지 여부를 측정했다. 코어 i9 7980XE는 2751점을 기록했고 코어 i7 5960X는 1153점을 기록했다. 약 2.2배가량의 성능 차이를 보여준다. 말 그대로 코어가 많으면 장땡이다. 아키텍처의 차이도 존재하지만 물리 코어의 수에도 큰 차이가 있다 보니 이런 압도적인 차이가 나타난다.

 

 

이번에는 OpenCL 명령어를 기반으로 렌더링을 진행하면 어느 정도의 차이가 있는지 알아봤다. 코어 i9 7980XE는 1435점을 기록했다. i7 5960X는 OpenCL 명령어 처리를 요청하니 716점이라는 성적표를 냈다. 역시 2배가량의 성능 차이다. 구세대 HEDT 프로세서로 고부하 작업을 진행하고 있는 하이-아마추어, 전문가, 기업이라면 상당한 메리트가 느껴지는 결과값이 아닐까?

 

 

▶ 렌더링 성능 비교 – Cinebench

 

마지막으로 측정한 벤치마크 소프트웨어는 시네벤치(Cinebench)다. R15 버전으로 테스트를 진행했다. 코어를 활용해 이미지 렌더링을 처리하고 이를 자체 점수로 표시한다. 높을수록 더 좋은 성능을 내는 것이므로 참고하자. 이와 달리 테스트가 시작되는 시점부터 마무리될 때까지의 시간을 따로 측정한 자료도 첨부했다. 시간은 당연히 수치가 낮을수록 우수함을 의미한다.

 

먼저 자체 계산되는 점수를 기반으로 성능을 가늠해 봤다. 코어 i9 7980XE는 36개 쓰레드가 활약하면서 3413점을 기록했다. 이에 비하면 코어 i7 5960X의 1454점은 초라하게 느껴진다. 2배 이상 차이다. 다중코어를 적극 활용하는 소프트웨어라면 그 수에 따른 효율의 차이는 당연한 것이다. 하지만 단 2세대 차이로 이 같은 결과를 만들어냈다는 점이 놀라울 따름이다.

 

 

이번에는 각각의 작업이 마무리되었을 때의 시간을 측정한 자료다. 위의 점수를 기록하기 위해 소요된 시간을 의미하므로 짧을수록 성능이 뛰어난 것이다. 일단 코어 i9 7980XE는 13초 만에 작업을 마무리 지은 반면, 코어 i7 5960X는 모든 작업이 마무리되는 데 29초가 걸렸다. 코어가 많을수록 유리한 작업이라면 18코어, 36쓰레드를 구현한 코어 i9 7980XE가 작업 효율에서는 확실한 우위를 점한다.

 

 

‘시간=돈’이라면 단연 압도적인 선택지 될 듯

 

코어 i9 7980XE의 성능은 가히 압도적이라 해도 과언이 아닐 정도다. 무려 18코어/36쓰레드다. 동작속도를 제외하고 코어 수로 단순 계산하면 6코어인 커피레이크 코어 i7 프로세서 3개가 동시에 일하는 것과 같다. 이는 자연스럽게 작업 효율 향상으로 이어진다.

 

뛰어난 성능을 낼 수 있는 이유는 여럿 있다. 먼저 새로운 명령어 추가에 주목할 필요가 있다. 코어 X-시리즈, 그중 i7 7800X 프로세서 이상 라인업에는 AVX(Advanced Vector Extensions)-512 명령어가 더해졌다. 이 명령어는 과학 시뮬레이션이나 분석, 인공지능, 딥러닝, 3D 모델링과 분석, 사진영상 인코딩과 디코딩 등을 쾌적하게 수행하도록 돕는다. 타 프로세서에는 AVX 2.0까지만 대응하고 있다.

 

▲ 코어 X-시리즈 프로세서는 이전과 달리 캐시 구성에도 변화를 줬다

 

AVX-512는 AVX2 FMA 유닛 2개를 묶어 구성한 것이다. 512비트 대역으로 연산 처리가 이뤄지는데, 이에 대응하는 애플리케이션은 한 클록 주기에 초당 32개 배정밀도(FP64), 64개 단정밀도(FP32)에 해당하는 부동소수점 처리가 가능하다. 캐시 구성의 변화도 성능에 영향을 줬다. 코어당 256KB였던 L2 캐시에 768KB 용량의 외부 캐시를 더해 1MB로 구성한 것은 코어의 접근성을 높인 큰 변화다. 여기에 24.75MB에 달하는 L3 캐시는 여유로움을 더한다.

 

변화를 통해 성능(효율)을 끌어올린 코어 i9 7980XE 프로세서. 대규모 코어를 앞세운 압도적인 성능은 1분 1초가 아까운 전문가 영역, 실시간 처리가 강조되는 소프트웨어를 다수 사용하는 환경에서 최고의 만족을 줄 것으로 예상된다. 게임도 하고 실시간으로 영상을 업로드하는 스트리머들에게도 적합한 성능을 기대할 수 있다. 

 

물론 1999달러, 국내에서는 약 270만 원 상당의 프로세서 가격은 개인 입장에서는 부담스러울 것이다. 그러나 더 나은 작업 효율을 위해 투자를 아끼지 않는다면 충분히 매력적인 프로세서라 하겠다. 고성능 프로세서가 꼭 필요한 작업은 대부분 시간이 곧 돈이기 때문이다.

 

 

기획, 편집 / 송기윤 iamsong@danawa.com
글, 사진 / 강형석 news@danawa.com
(c)가격비교를 넘어 가치쇼핑으로, 다나와