AMD의 새로운 하이엔드 그래픽카드는 어떨까?

조회수 2017. 8. 25. 00:45 수정
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 다양한 분야의 재밌고 유익한 콘텐츠를 카카오 플랫폼 곳곳에서 발견하고, 공감하고, 공유해보세요.

AMD Radeon RX Vega 64 & Vega 56

2017년 들어 가장 뜨거운 하드웨어 제조 업체를 필자에게 선정해보라고 한다면, 필자는 단연 "AMD"를 선정할 것이라고 생각합니다. 충격적인 성능이나 압도적인 기능을 보여준 것은 아니지만, 오랜 시간 부진을 거듭하던 CPU 시장에서 드디어 인텔에 맞서 경쟁할 수 있는 "라이젠" 프로세서를 생산해냈고, 여기에 한 발자국 더 나아가 인텔이 독점하다시피 하던 HEDT 시장에 "스레드리퍼" 프로세서로 출사표를 던졌기 때문입니다.


하드웨어 시장은 뜨겁게 달아오르기는 어려운 분야입니다. 점점 더 세밀해져서 이제는 더 이상 줄이기 어렵다는 평가를 받는 영역에 들어서는 '미세 제조 공정', 적절한 수준을 유지해야 하는 '소비전력', 그리고 '발열'이라는 제약이 뒤따르기 때문입니다. 물리적인 법칙을 뒤집어 엎거나 혁신적인 소재를 발견/개발하지 않는 이상 쉽사리 바꿀 수 없는 한계점 덕분인지 하드웨어 시장은 빠른 성장보다는 더디고 느린 성장을 거듭해왔습니다. "백 투 더 퓨처"의 2012년을 지나 "원더키디"의 2020년이 다가오고 있는 지금, 인류와 하드웨어는 꾸준한 진화를 거듭하고 있으면서도 차세대로의 전환이 쉽지 않은 이유는 아마도 이런 여러가지 제약 사항이 따르기 때문일 것입입니다.

그렇기 때문에 최근 정체기를 겪고 있는 하드웨어 시장에 작은 물결을 일으킨 AMD의 행보는 실로 놀랍다는 평가를 받을 수밖에 없습니다. 특히 경쟁사인 인텔보다 몇 세대 뒤처지고 있다는 평을 받고 있었기 때문에 그 충격은 더욱 컸습니다.

한편, CPU 분야에서 신선한 충격을 준 AMD가 최근 새로운 그래픽 카드 제품군을 발표했습니다. 이미 RX 400 시리즈가 공개되던 순간부터 무수히 입에 오르내리던 바로 그 제품, "RX 베가" 시리즈가 그 주인공입니다. 기존 Fiji 칩 라인업을 계승하겠다는 의지를 강력히 내포하고 있는 이 제품군은 최신 Vega 10 아키텍쳐가 적용된 그래픽 카드로, HBM2 메모리를 이용한 고대역폭 캐시를 지니고 있는 것이 특징입니다. 또한, 4,096개(RX 베가 56은 3,584개)의 스트림 프로세서를 갖추면서 코어 클럭은 기존 RX 400/500 시리즈보다 높은 수준을 지녀 10 TFLOPs를 넘나드는 높은 단정밀도 연산 능력을 갖추었고, 이와 함께 최근 딥러닝 기술에서 적극적으로 활용하고 있는 반정밀도 연산 처리 능력도 출중하여 단순히 게이밍을 위하는 제품이라기보다는 게이밍을 주축으로 하는 올라운드 그래픽 카드라는 인상을 강하게 받고 있습니다.


RX 베가 56과 RX 베가 64, 그리고 RX 베가 64 리퀴드 버전으로 각각 구분되는 3개의 베가 시리즈는 과연 PC 시장에 어떠한 영향력을 가지고 올 것인지 필자 역시 상당히 호기심이 일어납니다. 새롭게 "베가" 시리즈로 그래픽 카드 시장에 발을 디딘 AMD가 이번에는 어떤 성능을 보여줄 것인지, 지금부터 함께 살펴보도록 하겠습니다.

■ 제품 특성


※ 공식 홈페이지 : https://gaming.radeon.com/en/rxvega/

 - AMD Radeon RX Vega 64 : https://gaming.radeon.com/en/product/vega/radeon-rx-vega-64/

 - AMD Radeon RX Vega 56 : https://gaming.radeon.com/en/product/vega/radeon-rx-vega-56/


그래픽 카드 소개: AMD Radeon RX Vega

■ AMD Radeon RX Vega: AMD가 선보이는 새로운 그래픽 카드

AMD는 NVIDIA와 더불어 오랜 시간 PC용 그래픽 카드를 제조해온 업체 중 하나로, 플래그쉽 모델부터 엔트리 라인업까지 다양한 제품군을 생산해왔습니다. 특히 GCN(Graphics Core Next)이라 명명한 마이크로아키텍쳐를 적용하면서부터는 본격적인 고성능 그래픽 카드를 출시하기 시작했는데, "하와이" 칩을 필두로 한 Rx 200 시리즈부터 Fiji 칩이 탑재된 R9 Fury ~ Rx 300 시리즈, 그리고 14nm FinFET 제조공정이 적용되고 아키텍쳐를 재정립한 폴라리스 모델 RX 400 / 500 시리즈까지 다양한 제품군을 출시하면서 숨가쁜 여정을 달려 왔습니다. 특이한 것은 Fury 시리즈를 포함하고 있는 Rx 300 시리즈였는데, 기존 제품군들의 네이밍이 모두 넘버링으로 통합되던 이전과는 달리 고대역폭 메모리(HBM)와 4,096 SP를 탑재하여 강력한 성능으로 무장한 새로운 형태의 라인업이 등장했던 것입니다.

AMD의 하이엔드 포지션을 맡았던 Fiji 칩 제품군은 HBM의 탑재로 인해서 본래라면 그래픽 카드의 전체 PCB 크기를 상당 부분을 차지했어야 할 GDDR 램의 공간을 줄이는 것이 가능해 제품 크기 면에서 큰 이득을 보았고, 이러한 장점을 살려 ITX 케이스에도 들어갈 만한 크기의 작은 그래픽 카드 "R9 NANO"를 생산하는 등 경쟁사와는 다른 새로운 시도를 해왔습니다.


한편, 성능 측면에서는 당시 경쟁사의 하이엔드 모델이었던 GTX 980 Ti와 대적하는 모습을 보여주었는데, Full HD 해상도인 1080P에서는 상대적으로 떨어지는 성능을, 4K 해상도인 2160P에서는 상대적으로 비등하거나 앞서는 성능을 보여주었습니다. 물론 출시 후 드라이버를 지속적으로 업데이트하여 완전히 발휘하지 못하던 성능을 상당히 끌어올리기도 했지만, 여전히 해상도-성능의 상관 관계에서는 벗어나기 어려웠습니다(물론 게임의 최적화 여부에 따라 해당 내용은 다르게 적용될 수 있습니다).


Fury 시리즈가 출시 초기에 저해상도에서 높은 성능을 발휘하지 못한 까닭에는 여러 가지 추측이 있었는데, 많은 이로부터 문제로 지적된 것은 다름 아닌 "HBM"이었습니다. 고대역 메모리라는 용어의 HBM의 이름 그대로 4,096-bit의 넓은 대역폭을 지니고 있기는 하나, 메모리 클럭 속도가 상당히 낮은 것이 문제가 되었습니다. HBM1의 경우 500MHz의 HBM 모듈이 듀얼채널 방식으로 동작하여 1,000MHz의 유효 클럭을 지니고 있는데, 1080P 해상도에서는 일반적으로 넓은 대역폭을 요구하기 보다는 빠른 메모리 클럭 속도를 요구하기 때문에 낮은 메모리 클럭을 지닌 HBM의 실질적인 성능에 큰 영향을 미쳤다고 볼 수 있는 것입니다.

명절 때처럼 고속도로가 꽉꽉 막히는 상황이라면 8차선 도로가 높은 효율을 보여주겠지만, 평상시라면 도로 수가 많은 것보다는 제한 속도가 높은 쪽이 효율이 좋은 것과 같은 이치라고 볼 수 있습니다. 굳이 HBM을 고속도로에 비유해보자면, 60km/h 제한 속도가 걸린 8차선 도로인 셈입니다.


설상가상으로 Fury 시리즈는 가격적인 부분도 문제가 되었습니다. HBM을 생산하던 하이닉스 공장에 화재가 발생하면서 HBM 생산에 차질을 빚기도 했고, 그래픽 카드 공급이 어려워진 탓에 그래픽 카드 자체의 단가도 가파르게 상승했습니다. 또한, 코어와 HBM 메모리를 패키징하기 위해 "인터포저"라는 특별한 베이스 위에 수작업 제조를 해야 했고, HBM 메모리의 수율과 생산량이 상당히 적었기 때문에 많은 수량의 그래픽 카드를 만들어내지는 못했습니다. 이로 인해 전세계적으로 제품 판매가에 프리미엄이 붙어 본래의 MSRP보다 상당히 높은 수준의 금액으로 책정되는 등 여러모로 판매에 악영향을 주어 AMD의 입장에서는 달갑지 않았을 것입니다.

결국 MSRP로 $649였던 Fury X를 국내에서 구매하려면 120~130만원 수준의 가격을 지불해야 했던 것에는 이러한 요소들이 영향을 주었을 것입니다(물론 당시의 환율 등을 감안해볼 때 현시점과 가격적인 차이가 존재하기는 합니다).



Fury 시리즈를 포함한 Rx 300 시리즈 출시 이후, AMD는 차세대 그래픽 카드 개발에 돌입하면서 아키텍쳐를 새로이 재정립했습니다. Rx 300 시리즈까지는 기존 HD 7000 시리즈까지 활용된 일부 코어를 리비전하면서 하위 라인업을 채우는 형태였다면, RX 400 시리즈에서는 폴라리스 아키텍쳐를 기반으로 한 코어들로 메인스트림에서 엔트리 라인업까지 모든 라인업을 차곡차곡 채워 넣었습니다. GTX 10 시리즈를 출시하여 하이엔드부터 차근차근 출시하던 NVIDIA와는 달리, AMD는 판매량의 핵심 주축이 되는 메인스트림 라인업을 먼저 출시하면서 차세대 하이엔드 그래픽 카드인 Vega 시리즈를 준비해왔습니다. Vega의 ES 샘플로 보이는 것들의 성능 지표가 인터넷 상에 나돌면서 비교적 낮은 수치로 동작하는 클럭과 HBM2의 물량 확보가 문제로 대두되기도 했는데, 이런 논란을 종식시키기라도 하듯 Vega의 ES 샘플은 지속적으로 클럭을 높여왔습니다.

Vega가 출시되기 직전에 공개되었던 ES 샘플의 경우 1500~1600MHz 수준의 코어 클럭을 보여 클럭 확보에는 어느 정도 성공한 것처럼 비추어졌고, 필자를 비롯한 많은 사람들은 자연스레 Vega의 성능에 대한 궁금증이 일었습니다.

▲ RX Vega 64 & Vega 56 성능 비교표

그리하여, 제법 오랜 시간동안 튜닝과 제조 과정에 매진하던 Vega가 드디어 모습을 드러냈습니다. 많은 이들이 폴라리스 아키텍쳐를 확장하는 형태의 구조를 예상했던 것과는 달리, 베가 아키텍쳐로 새롭게 구성된 Vega는 4,096개의 SP(64 NCU)와 3,584개의 SP(56 NCU)를 갖춘 RX Vega 64 및 RX Vega 56 모델을 공개했습니다. RX Vega 64의 경우 다시 공랭식 쿨링 방식과 수냉식 쿨링 방식을 갖춘 두 가지 버전을 출시했으며, 공랭 버전은 레퍼런스 디자인 제품과 함께 Vega 로고를 품은 은색 외형의 Limited Edition 제품이 함께 출시되었습니다.

특히 Limited Edition의 경우 블로워 팬이 25mm에서 30mm로 확장되고, 블로워팬 부근의 R 로고에도 LED가 점등되는 등 외형적인 멋과 쿨링 성능이 조금 더 향상될 것으로 기대해볼 수 있겠습니다.


RX Vega 시리즈는 제품명에 붙는 64와 56에 따라 NCU(Next Gen Compute Units)가 64개인지 56개인지를 확인할 수 있습니다. 하나의 NCU는 각각 64개의 스트림 프로세서(SP)를 지니고 있기 때문에 RX Vega 64는 4,096개의 SP를, RX Vega 56은 3,584개의 SP를 지니게 됩니다. 코어 클럭의 동작 속도와 HBM2 메모리 속도에도 차등을 두고 있는데, 클럭 속도의 경우 RX Vega 64의 공랭식 버전과 수냉식 버전에 따라서도 차등을 두고 있어 최고의 성능을 원하는 게이머라면 RX Vega 64 Liquid Cooled 제품을 눈여겨볼 필요가 있을 것입니다.


기존 Fury 시리즈 제품군보다 저렴해진 가격도 눈에 띕니다. 특히 일부 SP가 커팅된 RX Vega 56의 경우 $399에 위치하여 GTX 1070과 실질적인 경쟁을 벌일 것으로 보이고, RX Vega 64는 $499의 MSRP를 지녀 가격 정책으로는 GTX 1080에 대항할 것으로 생각해볼 수 있습니다. 물론 Liquid Cooled 제품의 경우 $699가 책정되어 있어 기존의 Fury X보다 비싸지만, 이는 디스플레이나 메인보드 등 관련 제품의 할인 쿠폰과 더불어 2개의 게임 가격이 포함되어 있기 때문에 구매자에 따라 호불호가 갈릴 것으로 생각됩니다. 추가로 받는 혜택이 메리트 있다고 생각된다면 충분한 값어치가 될 것이라고 생각이 되는데, 이러한 정책이 한국에서는 어떻게 적용되고 녹아들지 지켜봐야할 대목입니다.

▲ 최초로 공개된 Vega 시리즈는 3종의 RX Vega 제품군으로 구성되며 RX Vega 64는 64개의 NCU로 4,096 SP를, RX Vega 56은 56개의 NCU로 3,584 SP를 탑재하게 됩니다.
▲ 최신예 게이밍 아키텍쳐를 갖춘 Vega 시리즈. 기존에 CU라 불리던 Compute Units에 '차세대'가 붙어 "NCU"로 명명된 것이 눈에 띄며, HBM 메모리는 "캐시"라고 표기되는 것을 알 수 있습니다. 메모리와 관련된 부분은 아래에서 다시 언급하도록 하겠습니다.
▲ RX Vega 64의 경우 4개의 비동기 컴퓨트 엔진과 4개의 지오메트리 엔진, 64개의 NCU(4,096 SP)와 256개의 텍스쳐 유닛, 64개의 ROPs 및 4MB의 L2 Cache를 지녔습니다. 여기에 2048-bit HBM2를 장착했습니다.

긴 공백을 깨고 AMD의 하이엔드 라인업이 드디어 모습을 드러냈습니다. HBM2로 업그레이드된 VRAM와 세밀해진 제조 공정의 영향으로 높은 수준까지 달성한 코어 클럭 등 다양한 장점을 지니고 있는 RX Vega 시리즈라고 생각되는데, 내부적으로 들여다보았을 때 어떠한 것들이 추가되거나 변경되었을까요?


■ AMD Radeon RX Vega: 무엇이 바뀌었나?

▲ RX Vega 64 블록 다이어그램.

RX Vega 시리즈의 베카 아키텍쳐는 어떠한 요소로 구성되어 있을까요? 겉으로 보기에는 조금 더 세밀해진 제조 공정으로 인해 줄어든 다이 크기와 향상된 코어 클럭, 메모리 변경 정도의 차이를 보이는 듯합니다. 의외로 RX Vega 시리즈에 탑재된 신기술 중 하나는 라이젠을 구성하고 있는 젠 아키텍쳐에서 찾아볼 수 있습니다. 바로 "인피니티 패브릭(Infinity Fabric, 이하 IF)"입니다.


IF는 SoC(System on Chip) 스타일의 인터커넥트로, 모듈-블록 간의 통신에 있어 짧은 지연 시간을 지니는 것이 특징입니다. QoS가 내장된 온칩상의 로직 블럭이나 보안 기능 사이에서 일관성 있는 커뮤니케이션 기능을 수행하는 특성을 지닌 IF는, 자체적으로 특정 기능을 지니고 있다기보다는 프로세서 설계 과정에서 상당히 유연하고 합리적인 모듈식 접근 형태를 취하는 내부 통로라고 할 수 있으며, Vega 아키텍쳐에서는 그래픽 코어와 함께 메모리 컨트롤러, PCI-Express 컨트롤러, 디스플레이 엔진, 비디오 가속 블럭과 같은 온칩상의 메인 로직 블럭을 연결하는 역할을 수행합니다.

이외에도 IF는 여러 특성을 지니는데, IF가 지니는 궁극적인 목적은 '통합성'이라고 할 수 있습니다. 앞으로 출시될 CPU나 APU, GPU는 Vega 아키텍쳐의 요소를 자연스럽게 내장할 것이고, 이는 전체적인 컴퓨팅 성능이나 사용자 경험을 더욱 이롭게 할 수 있습니다. 특히 시스템 내부의 자원이나 커뮤니케이션 이용에 있어 조금 더 유연한 모습을 보여준다는 측면에서 IF 기능이 시사하는 바는 크다고 할 수 있습니다. 물론 미래의 기술 통합을 위한 포석인 만큼 지금에 와서 IF가 단독으로 특별한 역할을 한다고 보기는 어렵지만, 앞으로 출시될 제품들은 더욱 성숙한 IF와 함께 유기적인 연결성을 지니게 될 것이라는 암시라고 이해하면 되겠습니다.


또 다른 핵심적인 변화는 메모리, 그리고 이를 제어하는 메모리 컨트롤러입니다. 하드웨어 소식에 관심이 많은 사람들은 기억하고 있으리라 생각하는데, 젠 아키텍쳐를 탑재한 새로운 APU는 HBM을 사용할 것이라는 루머가 있었습니다. 이와 맞물려서 생각해본다면, Vega 아키텍쳐에 탑재되는 새로운 형태의 메모리 계층 구조와 고대역 캐시 컨트롤러(HBCC)는 앞으로 있을 통합 과정을 염두에 둔 기술 개발일지도 모릅니다.

CPU와는 다른 의미에서, GPU는 엄청난 양의 데이터 이동을 필요로 합니다. 이는 GPU가 지니는 CPU와의 결정적인 차이, GPU는 병렬 프로세서로 구성되어 있기 때문입니다. 수많은 코어들이 최대의 성능을 발휘하기 위해서는 어마어마한 양의 데이터 I/O 처리가 발생하는데, 그래픽 카드는 이를 충족시키기 위해서 넓은 대역폭의 메모리 혹은 빠른 클럭 속도로 대역폭을 충당하는 고급 메모리를 탑재하게 됩니다. 여기에 추가적으로 L1, L2와 같은 계층적 캐시 시스템을 활용하게 됩니다.


GPU는 카드에 내장된 로컬 비디오 메모리(VRAM)에 데이터나 리소스 전체를 보관해야 하는데, 점차 커져가는 텍스쳐 용량이나 처리해야 하는 데이터량이 늘어나는 것과는 달리 VRAM에는 물리적인 적재량의 한계가 뚜렷합니다. 그럼에도 불구하고 데이터 및 리소스 전체를 VRAM에 적재해야 하는 이유는 현재의 컴퓨터 시스템으로 수행할 수 있는 뚜렷한 대안이 없기 때문입니다. 이론상으로 대두되는 대안 중 하나는 PCI-Express 버스를 통해서 호스트 시스템 메모리(시스템 메모리)를 이용해 데이터 I/O처리를 하는 것입니다. 쉽게 말해서, PCI-Express라는 경로와 시스템 메모리를 활용해서 데이터 I/O 처리 효율을 높이자는 것입니다. 이러한 대안점이 현실적으로 적용될 수 없는 까닭은 그래픽 카드에 내장된 비디오 메모리가 충분한 대역폭을 지니지 못하고, 시스템과 통신하는 과정에서 발생하는 레이턴시가 제법 길어서 현실적인 적용에는 어려움이 따르기 때문입니다. 대역폭과 레이턴시 문제를 해결하기 위한 다양한 시도가 있었지만, 결국은 HSA가 널리 퍼지지 못했던 결정적인 문제와 봉착하게 됩니다. 메모리 관리의 복잡성과 소프트웨어 개발의 난이도가 엄청나게 상승되는 것입니다.


Vega 아키텍쳐는 이러한 문제점에 착안하여, 흔히 VRAM이라 부르는 로컬 비디오 메모리가 최종 레벨 캐시(Last-Level Cache)처럼 동작할 수 있게끔 설정하는 것이 가능합니다. 메모리라는 표현 대신 HBC(High-Bandwidth Cache; 고대역 캐시)라는 용어를 활용하는 까닭도 여기에 있습니다. 

▲ HBCC 유무에 따른 적재 방식 차이.

시스템 메모리에서 필요한 자원을 로컬 비디오 메모리로 가져오기 위해서는 동등한 형태의 영역을 배치해야 하는데, 데이터 및 리소스 별로 할당이 필요하기 때문에 로컬 비디오 메모리를 초과하는 데이터에 대해서는 적재하는 것이 어려웠습니다. 4GB의 VRAM을 지닌 그래픽 카드에서 이미 3.5GB 정도의 데이터를 배정했는데, 이후 들어와야할 텍스쳐 데이터가 700MB라고 한다면 4GB를 초과해버리므로 이미 사용하거나 사용중인 데이터와 교체가 필요하게 된다는 것입니다. 이 때문에 작은 VRAM에서 높은 용량의 텍스쳐나 데이터를 배정해야 하는 게임을 실행하면 상당한 병목 현상이 발생하게 됩니다. HBCC를 활용하면 PCIe 버스를 통해 GPU가 처리에 필요로 하는 데이터를 시스템 메모리로부터 일정 크기로 페이징하여 빠르게 적재하는 것이 가능합니다. 시스템 메모리와 VRAM을 최대한 활용하여 마치 VRAM이 크게 확장된 것처럼 활용하는 것이 가능하다는 이야기입니다.

HBCC를 활용할 경우, 최대 512TB의 가상 주소 영역을 제공하는 49비트 주소를 지원합니다. 이는 일반적인 CPU가 액세스할 수 있는 48비트의 주소 공간을 충분히 커버한다는 의미이자, CPU가 인식 가능한 범주의 시스템 메모리를 충분히 활용할 수 있다는 이야기로 해석할 수도 있습니다. 사실 일반적인 사용자의 경우 HBCC를 활용한 매우 넓은 영역대의 로컬 메모리(VRAM)를 요구하지는 않을 것입니다. 고사양 시스템을 요구하는 최신 게임이라고 해도 4K 해상도를 기준으로 요구하는 VRAM의 용량은 8GB를 넘어서는 경우를 찾아보기 어렵기 때문입니다. 다만, 텍스쳐팩을 비롯해 게임을 조금 더 이롭고 흥미롭게 만들어주는 모드(MOD)를 지원하는 게임의 경우, 모드의 종류에 따라 10GB 이상의 VRAM을 요구하는 경우를 간혹 만나볼 수 있습니다. 아마도 HBCC가 빛을 발하는 순간은 그러한 상황과 맞닥뜨렸을 때라고 생각합니다. 아마도 HBCC 기술을 적극적으로 활용할 수 있는 곳은 서버나 워크스테이션 분야일 것이며, 나아가 나중에 출시될 메인스트림-엔트리 라인업 그래픽 카드에서는 작은 VRAM으로도 높은 데이터 처리 요구량을 어느정도 원활하게 처리하는 것에 일조할 것입니다.

또 한가지, 그래픽 카드에 탑재된 VRAM 이상의 영역에 핸들링할 수 있는 이런 대용량 하드웨어 관리 스토리지 풀은 더 높은 해상도의 텍스쳐나 높은 폴리곤 수와 프레임을 지닌 애니메이션 등 더욱 현실적인 가상 세계를 만드는데 도움을 줄 수 있으며, 이러한 처리 과정을 돕기 위해 베가 아키텍쳐는 모든 그래픽 블록이 L2 캐시의 클라이언트를 지니게 되어 기존 Fury X가 지닌 2MB보다 2배 늘어난 4MB 크기의 L2 캐시를 지니게 되었습니다.

이밖에도 베가 아키텍쳐는 다양한 장점을 수용하고 있습니다. 차세대 지오메트리 엔진과 Rapid Packed Math(이하 RPM)를 지원하는 새로운 NCU, 개선된 픽셀 엔진, 제조공정의 성숙으로 더욱 높은 영역에 도달한 클럭 등 많은 장점을 포함하고 있어 여러 방면에서 기대가 되고 있습니다. 특히 RPM은 이미 콘솔이나 HPC(High-End Compute) GPU 등에서는 사용되고 있던 기술로, 수많은 머리카락과 같이 정밀함보다는 고속 처리가 필요할 경우 단정밀도(FP32)나 배정밀도(FP64)보다는 반정밀도(FP16)를 활용하여 빠르게 처리하는 것을 가능케 해줍니다. RX Vega는 20TFLOPS 이상의 빠른 반정밀도 연산 처리가 가능한 만큼 해당 기술을 지원하는 게임에서 프레임레이트 상승 및 유지에 도움을 줄 것으로 예상됩니다.

게이밍 기능에 향상점을 둔 것도 눈여겨 볼 만한 부분입니다. 특히 NVIDIA 최신 그래픽 카드에서 지원하던 Fast Sync 기능의 대항마로 Enhanced Sync 기능이 새롭게 추가되었는데, VSync 특유의 인풋렉을 개선하면서 티어링 현상은 완화시키는 기술이기 때문에 더욱 매끄러운 게이밍 경험을 제공해줄 수 있을 것으로 기대됩니다. 여기에 FreeSync 지원 모니터를 지속적으로 늘려가고 있으며, 정식 지원 목록에 없더라도 국내의 많은 모니터 유통사들이 FreeSync 기능을 탑재하는 추세이기 때문에 G-Sync에 비해 상대적으로 저렴한 게이밍 환경 구성이 가능하겠습니다.

▲ RX Vega 64와 R9 Fury X의 스펙 비교표. RX Vega 64는 2048-bit의 HBM2를 활용하기 때문에 최대 렌더 백엔드 처리량은 조금 떨어지는 경향을 보였지만, 이외에는 대부분 50% 수준 이상 향상된 수치를 보여주었습니다.

또한, 베가 그래픽 카드는 메모리 컨트롤러나 HBCC를 적극 활용하기 위한 넓은 대역폭의 메모리로 HBM2를 채용했습니다. 다수의 DRAM을 하나의 다이로 패키징하는 HBM 기술의 특성상 하나의 다이만으로도 여러 DRAM이 스택 구성되어 있는 효과가 있어 1024-bit의 버스를 지니게 되었습니다. 그 중에서 Fury 시리즈 제품의 경우 4개의 스택을 활용하여 4096-bit 메모리 버스를 지니게 되었지만, 기본 클럭 속도가 500MHz 수준으로 제한적이었고 다이당 용량이 1GB이었기에 최대 4GB의 제한적인 VRAM을 지닐 수밖에 없었습니다. Vega 시리즈에 탑재된 HBM2는 2개의 스택을 이용해 전체 대역폭은 기존 Fury 시리즈의 절반인 2048-bit를 지니게 되었지만, 메모리 클럭이 800MHz 이상으로 향상되어 1.6Gbps~1.9Gbps 수준에 달하는 속도를 지니게 되었습니다. HBM 1세대에서 문제로 지적되던 메모리 클럭을 끌어올리면서 스택 패키징 범위는 더욱 늘려 하나의 다이에도 높은 메모리 용량을 탑재하는 것이 가능해졌다는 것도 장점으로 작용합니다.

베가 그래픽 카드와 여기에 담겨진 베가 아키텍쳐는 여러 방면으로 훌륭한 성장을 거듭했습니다. 이러한 성능이 고스란히 게임 성능을 이어진다면 정말 좋겠지만, 현실적으로는 어려울 것입니다. 기술만 세상에 모습을 드러내어서는 성능으로 곧장 직결되지는 않기 때문입니다. 그러한 점에서 AMD ReLive Crimson 드라이버의 지속적인 업데이트는 반갑게 다아옵니다. 처음부터 최대의 성능을 낼 수 있다면 베스트겠지만, 차선책으로 꾸준한 드라이버 업데이트에 노력을 기울이고 있는 만큼 지속적인 성능 안정화를 기대해볼 수 있습니다. 여기에, 내부적으로 많은 부분에서 개선이 이루어진 아키텍쳐인 만큼 아키텍쳐 본연의 기능을 십분 활용하기 위한 게임 지원도 이루어져야 할 것입니다.


사진: AMD Radeon RX VEGA 64 샘플 패키지
▲ AMD Radeon RX Vega 64 샘플 패키지 사진입니다.
▲ AMD Radeon RX Vega 64 샘플 패키지 상단에는 제품명과 더불어 우주의 별을 연상케하는 이미지가 눈에 띕니다.
▲ AMD Radeon RX Vega 64 샘플 패키지 하단 사진입니다. 제품의 시스템 요구사양이 기재되어 있습니다. AMD Radeon RX Vega 64는 최소 750W급 파워 서플라이를 요구합니다.
▲ AMD Radeon RX Vega 64 샘플 패키지를 개봉하는 모습입니다.
▲ AMD Radeon RX Vega 64 샘플 패키지 구성품입니다. 그래픽 카드 박스와 베가 로고가 새겨진 기념패, 구성품 박스, 안내서로 구성되어 있습니다.
▲ AMD Radeon RX Vega 64의 코어부를 측면에서 촬영한 사진입니다. 코어와 HBM2 간의 단차가 미세하게 존재하는 것으로 보이는데, 써멀 컴파운드로 코어부와 쿨러의 간극을 충분히 해소해줄 수 있는 수준으로 판단됩니다. 1세대라고 할 수 있는 Fury X의 경우보다는 훨씬 나아진 모습입니다.
▲ AMD Radeon RX Vega 64 그래픽 카드의 정면 사진입니다.
▲ AMD Radeon RX Vega 64 그래픽 카드의 후면 사진입니다.

※ 본 리뷰의 자세한 벤치마크 및 테스트는 아래 플레이웨어즈 홈페이지에서 확인해주시기 바랍니다.


결론

지난 2015년 6월 말, AMD는 세간의 주목을 받으며 "AMD Radeon R9 Fury X" 제품을 출시했습니다. HBM을 이용하여 기존 메모리가 지니던 대역폭의 한계를 뛰어넘음과 동시에 기판 크기를 상당히 줄여 높은 성능과는 상반되게 작은 크기를 지니는 것이 가능했습니다. 고성능 그래픽 카드는 일정 크기 이상의 커다란 PCB를 지녀야했던 기존의 패러다임을 전환하는 것이 가능했던 이 Fiji 칩 제품 시리즈는 작은 크기의 ITX 시스템을 구성하려는 사람이나 AMD 그래픽 카드로 높은 성능을 추구하던 사람들에게 많은 주목을 받았습니다. 하지만 애석하게도 Fiji 칩 제품군은 생산량이 수요량을 따라가지 못해 최초 출시 때 발표되었던 MSRP를 넘어선 높은 가격을 유지할 수밖에 없었고, 이는 사용자들의 구매를 막는 방해 요소로 자리를 잡았습니다. 국내의 경우 120만원이 넘는 가격으로 런칭되었기 때문에 쉽사리 구매하기에는 상당한 부담으로 작용했습니다.


Fiji 칩 시리즈가 출시된 지도 어언 2년이 지났습니다. 그리고 드디어 AMD의 차세대 하이엔드 그래픽 카드인 RX Vega 시리즈가 모습을 드러냈습니다. 새롭게 AMD 하이엔드 그래픽 카드를 구매하고자 했었다면, 참 오랜 기다림이었을 것이라는 생각이 듭니다. 사실 이미 Radeon Pro 라인업으로 "Radeon Vega Frontier Edition"이 출시는 되었습니다. 하지만 이는 오롯이 게임을 위한 그래픽 카드라기보다는 다용도로 활용하기 위한 목적이 짙기 때문에 게이밍 카드를 원하는 사람들을 위한 제품은 아니었습니다.

RX Vega 64는 전작과 동일하게 4,096개의 SP를 지니고 있기는 하지만, CU(Compute Unit)의 구성을 바꾸어 한층 새로워진 NCU(Next-Gen CU)로 구성되었다는 점을 비롯해 여러 측면에서 변화를 준 Vega 아키텍쳐가 도입되어 기존 제품과의 차별화를 언급했습니다. 또한, 기존의 Fury X가 지적 받았던 HBM의 속도를 한층 더 끌어올린 HBM2를 도입하여 전반적인 성능을 높이기 위한 노력을 기울이기도 했습니다. 여기에 Rapid Packed Math를 비롯해 HBCC와 같이 차세대 그래픽 카드에 어울리는 신기술도 다양하게 포함하고 있어 게임에 더욱 최적화된 환경을 제공해주고 있습니다. 물론 RX Vega 시리즈에 포함되는 다양한 기능을 온전히 사용하기 위해서는 일련의 시간이 걸리겠지만, 더 나은 게이밍 경험을 위해 여러가지 시도를 한다는 점에서는 높은 점수를 주고 싶습니다.


테스트를 통해 확인해본 RX Vega 시리즈의 성능은 강렬한 인상을 주기는 어려웠습니다. 비교 대상이 되는 그래픽 카드인 GTX 1080이나 GTX 1070은 이미 출시한 지 1년이 훌쩍 지난 모델들이기 때문입니다. 물론 그 사이에 신모델이 출시하지는 않았지만, GTX 1080 Ti라는 최상위 모델과의 비교가 어렵다는 것은 조금 아쉬운 부분입니다. 하지만 가격적인 측면에서는 경쟁력을 높이려는 시도를 보입니다. RX Vega 56의 경우 $399의 MSRP로, Vega 64는 $499의 MSRP로 출시하여 각각 GTX 1080과 GTX 1070과 직접 경쟁에 돌입하게 되었습니다. 물론 이러한 가격은 MSRP일 뿐이기 때문에, 국내 시장가로 얼마나 적절하게 런칭될런지 여부도 중요하게 작용할 것입니다.


벤치마크 성능을 본다면 RX Vega 64는 GTX 1080과 비등하거나 조금 더 높은 성능을, RX Vega 56은 GTX 1070보다 평균적으로 높은 성능을 보여주었습니다. 4,096개의 SP를 이용해 높은 연산력을 보이는 만큼 벤치마크 테스트에 있어서도 고스란히 영향을 준 대목이라고 생각합니다. 반면 게이밍 성능에서는 일장일단을 보여주었습니다. DX12 게임에서는 평균적으로 RX Vega 시리즈가 경쟁 제품보다 높은 성능을 차지했지만, DX11 게임에서는 정반대의 결과로 경쟁 제품들이 RX Vega 시리즈를 앞섰기 때문입니다. 앞으로 출시될 게임들은 DX12를 지원하는 게임이 많아질 것이기는 하지만, 현시점에서 하이엔드 수준의 성능을 원하는 사람들에게는 일말의 아쉬움이 남을 수도 있습니다.

하지만 초점을 Fury X로 맞추어본다면 이야기가 조금 달라질 수 있습니다. RX Vega 56은 3,584 SP를 지니고 있지만, 그럼에도 평균적으로 Fury X보다 높은 성능을 보여주었으며, RX Vega 64는 Fury X보다 30% 가량 향상된 성능을 보여주었기 때문입니다. 이는 세밀해진 제조 공정으로 인해 클럭을 더욱 끌어올릴 수 있었기 때문이며, 새롭게 재배치된Vega 아키텍쳐의 영향력도 존재할 것입니다.


아래는 테스트 결과를 간략히 요약한 그래프입니다.

RX Vega 64에 오버클럭을 적용할 경우, 상당한 수준의 게이밍 성능을 보여주었습니다. 물론 여기에서도 DX11 게임인지 DX12 게임인지 여부가 중요하게 작용하기는 하지만, 전반적으로 좋은 성능을 보여주는 것은 사실입니다. RX Vega 시리즈의 성능 측정에 있어서 눈에 띄는 부분은 1080P 해상도에서의 성능이었습니다. 기존 Fury X를 비롯한 Fiji 칩 제품군들이 1080P 해상도에서 상대적으로 높은 성능을 발휘하기 어려웠던 까닭은 500MHz(1Gbps 유효 클럭) 수준의 HBM 때문이라는 평가가 지배적이었습니다. 하지만 RX Vega 시리즈에는 HBM2를 도입하여 전체 대역폭은 절반으로 줄었지만 클럭 스피드를 1.6~1.9배 가량 상승시킬 수 있어서 1080P 해상도에서도 안정적인 성능을 발휘할 수 있었다고 생각합니다.


또한, RX Vega 시리즈는 3개의 성능 프로필을 지니고 있어 사용자가 즐기는 게임에 따라서 최적의 성능과 소비전력을 유지하는 것이 가능합니다. RX Vega 56 Turbo 모드와 RX Vega 64 Power Save 모드의 게이밍 성능이 거의 비슷하게 측정되는 것을 확인했는데, 일반적인 상황에서는 기본값인 Balanced 모드가 무난한 수준의 성능을 보여주었습니다.


게이밍 성능에서 경쟁 제품인 GTX 1080 및 GTX 1070과 적절한 경쟁을 펼치는 수준을 보여주었다면, 소비전력에서는 다소 아쉬운 모습을 보여주었습니다. 특히 RX Vega 64를 오버클럭할 경우 500W가 넘어가는 수준의 평균 소비전력과 580W 수준의 피크치를 보여, 안정적인 시스템 활용을 위해서는 80PLUS 등급의 700W급 이상 파워 서플라이가 필요할 것으로 예상됩니다. 경쟁 제품이 300W 안쪽의 소비전력을 보인다는 점을 감안했을 때 상당히 높은 수치라고 할 수 있는데, 이는 많은 수의 SP가 탑재된 빅칩 제품이라는 점도 있겠지만 안정적인 게이밍 성능을 위해서 스윗 스팟을 지나 높은 클럭을 끌어올렸기 때문이라고 추정됩니다.

다만, 성능 프로필의 설정으로 소비전력을 어느 정도 억제할 수 있으며, Chill 기능을 지원하는 게임에서는 낭비되는 자원을 억제해 소비전력의 하락 효과를 얻는 것이 가능합니다. 풀로드가 걸리는 테스트에서는 비교하기가 난해할 정도의 차이를 보이기는 했지만, Chill 기능과 더불어 적절한 성능 프로필을 설정한다면 소비전력을 상당한 수준까지 낮출 수 있을 것으로 예상됩니다.

성능 문제를 넘겼다면 남은 문제는 가격입니다. RX Vega 시리즈는 기본적으로 빅칩을 활용하는 만큼 저렴하기가 어려운 라인업입니다. 여기에 HBM2를 하나의 다이에 포함해야 하는 패키징 기술을 고려했을 때 단가를 일정 수준 이하로 낮추기란 어렵다는 결론에 이릅니다. 그래서인지 AMD는 "RADEON PACK"이라는 이름으로 그래픽 카드 번들을 구상했습니다. 번들 상품을 구매할 경우 AMD 관련 PC 컴포넌트에 대한 할인권과 게임 쿠폰을 제공해주기 때문에, 만약 FreeSync를 지원하는 모니터나 RYZEN으로 구성된 시스템을 구성하고자 한다면 번들 상품으로 인한 메리트를 느낄 수 있을 것입니다.

(단, 번들 상품에 대한 구성 여부는 유통사를 통해 확인하시기 바랍니다.)


개인적인 시각에서 보았을 때, RX Vega 시리즈는 아직 모든 부분에서 성능을 온전히 발휘하는 것은 아니라고 봅니다. HBCC 기능을 활성화했을 때 일부 게임에서는 성능의 이득을 보지만, 기능 ON/OFF로 인한 블루스크린 문제 등 아직 해결해야 할 문제점들이 남아있기 때문입니다. 게임사와의 협업을 통한 성능 최적화 역시 필요한 부분이라고 생각합니다. AMD는 RX Vega 홍보에 있어서 Far Cry 5나 Wolfenstein II: The Colossus와 같은 미출시 게임에서 특정 기술들이 최적화되었음을 시사한 바가 있습니다. 앞으로 나올 게임들에 대해서는 한층 더 최적화된 성능과 RX Vega가 지닌 다양한 기능으 십분 발휘할 수 있기를 기대해보도록 하겠습니다.


AMD 그래픽 카드로 하이엔드급 성능을 요구하는 게이머에게는 RX Vega 64를, GTX 1070 수준의 성능에 FreeSync를 비롯한 여러 기능을 십분 활용할 수 있는 그래픽 카드를 원하는 사용자에게는 RX Vega 56을 추천해보며 리뷰를 마치도록 하겠습니다.



* 권장 소비자가(MSRP)

 - AMD Radeon RX Vega 64 Liquid Cooled(AMD 컴포넌트 할인 + 게임 쿠폰 포함): $699

 - AMD Radeon RX Vega 64 Limited Edition(AMD 컴포넌트 할인 + 게임 쿠폰 포함): $599

 - AMD Radeon RX Vega 64 Air Cooling: $499

 - AMD Radeon RX Vega 56: $399



* 국내 인터넷 최저가

 - AMD Radeon RX Vega 64 Liquid Cooled: 1,186,500원

 - AMD Radeon RX Vega 64 Limited Edition: 미정

 - AMD Radeon RX Vega 64 Air Cooling: 801,000원

 - AMD Radeon RX Vega 56: 미정

이 콘텐츠에 대해 어떻게 생각하시나요?