컴퓨팅 환경은 꾸준히 변화하고 있다. 단순히 형태가 변한다기 보다 활용의 범위가 점차 넓어지는 중이다. 특히 다수의 코어를 활용한 애플리케이션이 이를 주도하고 있다. 과거 1~2개의 쓰레드(Thread)를 활용하던 애플리케이션들이 이제는 프로세서가 제공하는 쓰레드들을 효과적으로 사용하게 되면서 효율성이 크게 개선됐기 때문이다.


그러나 최근에는 이런 다수의 쓰레드를 활용하는 애플리케이션 다수를 동시에 사용하는 메가태스킹(Megatasking) 시대에 접어들었다. 영상 변환 작업과 게이밍, 컴퓨팅 연산 등을 분리해 각각 진행하는 것이 아니라 엄청나게 많은 코어를 활용해 이들을 동시에 진행하는 것이다.


이런 시대에 대응하기 위해 PC 시스템은 진화를 거듭해왔다. 싱글코어에서 듀얼코어 그리고 쿼드코어 등 코어의 수는 꾸준히 증가했고 효과적으로 다루는 기술도 적극 도입됐다. 이것도 모자라 프로세서는 더 많은 코어를 탑재해 제공되기 시작했다. 인텔 익스트림 프로세서 라인업이 대표적이다.


©

 


더 많은 작업을 빠르고 효과적으로 처리하기 위해 출시된 인텔 익스트림 프로세서는 펜티엄 시절에도 존재했지만 다수의 코어를 품어 본격적인 메가태스킹 시대를 연 것은 코어 i7-7900X 시리즈 익스트림 이후다. 처음으로 6개의 코어를 탑재하면서 화끈한 성능을 추구하는 PC 사용자들의 지지를 얻었다. 이후 꾸준히 코어 수와 성능을 개선하면서 인텔 HEDT(High End Desktop) 프로세서로 자리매김했다.


지난 6월, 인텔은 대만에서 열린 IT전시회 컴퓨텍스를 통해 새로운 변화를 발표했다. 별도 분리되어 운영 중인 HEDT 라인업을 ‘코어 X-시리즈’라는 이름으로 브랜드화 한 것이다. 이와 함께 코어 i7 익스트림은 코어 i5/i7/i9 X-시리즈로 세분화되어 운영될 것이라는 내용도 언급됐다. 그리고 오랜 시간이 지나지 않아 인텔은 달라진 모습을 담은 코어 i9-7900X를 선보이게 됐다.


■ 10C/20T 구성의 고성능 프로세서


코어 i9 X-시리즈는 최대 18코어 36쓰레드(18C/36T) 구성의 HEDT 프로세서다. 그 중 코어 i9- 7900X는 10코어 20쓰레드 구성이다. 단순히 구성으로만 보면 이전 세대 플래그십 프로세서 코어 i7-6950X와 동일하다. 하지만 기본 작동속도가 3GHz에서 3.3GHz로 증가했으며, 그에 따른 터보부스트 속도도 3.5GHz에서 4.3GHz로 증가했다.


인텔 플래그십 프로세서는 항상 이전 세대 주력 프로세서의 아키텍처에 기반한 다중코어 프로세서다. 예로 코어 i7 6950X는 6000대 제품명을 쓰지만 해당 라인업의 아키텍처인 스카이레이크가 아니라 브로드웰-E(Broadwell-E)였다. 이는 일반 시장을 겨냥한 초고성능 제품군이지만 근간은 서버/워크스테이션 프로세서에 있기 때문이다.


 


▲ ©

 


코어 i9-7900X도 마찬가지다. 7000대 넘버링을 채택했지만 코드명은 스카이레이크-X다. 동시에 7세대가 아닌 6세대 HEDT 프로세서라 부른다. 코어 익스트림 프로세서에 2000번대 넘버링이 존재하지 않아서다. 존재하긴 했지만 모바일용 고성능 프로세서였기에 논외로 하자.


스카이레이크 아키텍처에 기반하기에 해당 기술은 고스란히 품었다. 반면, 아키텍처를 제외한 대부분 요소는 데스크톱 프로세서와 완전히 다른 노선을 걷고 있다.


▲ ©

 


지원 메모리 컨트롤러의 대응 속도도 2,133MHz에서 2,600MHz로 빨라졌고, 명령어 구성과 캐시 구조도 뿌리 자체가 다르다. 7900X에서는 AVX 2.0과 함께 AVX-512가 새로 추가됐다. 캐시도 기존과 달리 13.75MB가 탑재된다. 데스크톱 스카이레이크 프로세서는 최대 8MB의 스마트캐시를 썼다. 이전 익스트림 프로세서는 25MB니까 이들을 단순 계산하면 코어당 2MB와 2.5MB다. 그런데 7900X는 코어당 1.375MB라는 계산이 나온다. 오히려 통합 캐시 용량은 줄어든 셈이다.


 

 



이유는 코어 X-시리즈에서 인텔이 캐시 사용 정책에 변화를 줬기 때문이다. 프로세서는 흔히 L1부터 L3까지 캐시를 구성하고 있다. L1과 L2는 코어에 바로 붙어 있어 즉시 데이터를 주고 받을 수 있고 L3는 코어에 모두 공유되어 필요에 따라 할당되는 방식이었다.


그러나 코어 X-시리즈에서는 모든 캐시가 직접 운영되는 구조를 취했다. 그 대신 상대적으로 용량이 적은 L2 캐시의 용량을 1MB로 크게 늘렸다. 기존에는 256KB를 써왔기 때문에 차이가 두드러진다. L3 캐시 용량을 줄이고 L2를 늘려 반응성 자체를 개선했다는 점은 두드러지는 부분이라 하겠다.


■ 설계의 변화에 의한 플랫폼의 변화


코어 i9-7900X 시리즈를 포함한 코어 X-시리즈의 핵심은 설계의 변화에 있다. 이전 세대인 코어 i7-6950X 프로세서까찌는 코어와 캐시, 메모리 컨트롤러와 기타 내부 장치들이 원형으로 배치되는 링버스(Ring-Bus) 방식의 설계로 만들어졌다. 순차적으로 통신함으로써 불필요한 접근을 줄이고 성능을 개선할 수 있었다.


문제는 코어의 수가 많아지는 HEDT 프로세서의 특성상 자연스레 링버스 구조는 데이터 전송과 처리가 지연된다. 이를 해결하기 위해 속도를 높이거나 DDR4 메모리 대역을 높이는 등 해결책을 제시하며 신제품을 선보여 왔다. 그러나 10 코어 이상 탑재하려면 기존의 링버스 설계로 한계가 따를 수 밖에 없다. 덩치가 엄청나게 커지거나 밀도를 높여야 하지만 둘 다 비효율적이다.


 


▲ ©

 


인텔이 고안한 것은 바로 각 코어와 컨트롤러, 캐시 등이 그물처럼 엮은 형태다. 메시 아키텍처(Mesh Architecture)라는 이름의 설계 방식은 각 구성들이 빠르게 통신할 수 있도록 만들어졌다. 직렬로 배치하면 되므로 설계나 생산 측면에서도 이점을 얻는다. 코어를 늘리는 데에도 유리하다.


대역폭 확보가 비교적 쉽기 때문에 낮은 작동속도에서도 제법 괜찮은 성능을 이끌어내는 것도 가능하다. 앞으로 출시될 상위 라인업의 작동속도(2.6~3.1GHz)만 보더라도 어느 정도 이해가 되는 부분이다.


장점만 있는 것은 아니다. 내부적으로 코어와 캐시가 애플리케이션에 따라 어떻게 작동하는지 결정하는 부분에서의 최적화가 이뤄지지 않는다면 성능 하락은 피할 수 없다. 대역폭은 증가했지만 기본 작동속도 자체가 낮기 때문에 코어를 많이 쓰지 않는 애플리케이션에서의 대응 능력도 지켜봐야 할 부분이다. 인텔은 이를 터보부스트로 해결하고자 했다. 코어 i9 7900X만 해도 기본 속도는 3.3GHz지만 터보부스트 속도가 4.5GHz라는 점이 이를 잘 말해준다.


 


▲ ©

 


새로운 설계와 구조를 채택하면서 플랫폼 자체에도 변화가 필요했다. 인텔은 이전 세대 HEDT 프로세서가 사용한 X99 칩셋과 LGA 2011(v3) 소켓을 쓰지 않고 X299라는 새로운 칩셋과 LGA 2066 소켓 규격을 제시했다. 핀 배열이 증가하고 배치도 달라졌기 때문에 이전 프로세서와의 연결고리는 없다.


기본적으로 X299 칩셋 메인보드는 쿼드채널 구조 DDR4 메모리와 PCI-Express 44레인이 제공된다. 카비레이크부터 호흡을 맞춘 인텔 옵테인 메모리(Optane Memory)도 호환한다.


■ 변화하는 PC 환경을 위해 시작된 도전


▲ ©

 


코어 i9-7900X를 시작으로 향후 12~18코어 프로세서가 서서히 모습을 드러낼 예정이다. 그러나 현재로써는 10코어 20쓰레드를 제공하는 i9 7900X가 인텔 HEDT 프로세서의 간판으로 활약하게 된다. 단순히 이전 세대와 코어/쓰레드 수는 같지만 속을 들여다 보면 달라진 요소들이 제법 존재하며, 이는 전반적인 컴퓨팅 환경에 영향을 줄 것으로 보인다.


우선 새로운 프로세서들은 다중 코어를 적극 활용하는 환경에 최적의 효율을 제공한다. 사진/영상 편집을 시작으로 콘텐츠 크리에이터와 스트리머, 그래픽 디자이너 등이 대상이다. 고부하 작업을 여럿 또는 동시에 실행하는 메가태스킹(Megatasking) 환경이라면 코어 i9-7900X 또는 그 이상 라인업은 이상적일 수 있다. 최근 게임도 코어를 여럿 활용하는 추세로 흘러가기 때문에 고성능을 추구하는 게이머에게도 적합하다.



[ 경제신문의 새로운 지평. 베타뉴스 www.betanews.net ]