PC, 하드웨어/하드웨어 사용기

NVIDIA RTX A4000 리뷰

Charlemagne 2021. 8. 4. 22:31

아마도 국내 리뷰 중에서는 1호가 되지 않을까 싶은 NVIDIA RTX A4000 리뷰입니다.

 

사실 리뷰라고 해도 하드웨어 전문가가 아닌 일반 사용자이기 때문에(저도 배우고 있는 입장입니다), 이 글을 읽는 분들에게 딱히 많은 걸 보여드릴 수는 없으나, 대충 이 제품이 어떻게 생겨먹었는지, 또 어떻게 활용할 수 있는지에 대해서 도움을 받으실 수 있었으면 좋겠습니다.

 

사실, 이 제품은 소비자를 대상으로 나온 제품이 아니기 때문에 일반적인 사용자가 접할 일은 딱히 없는 제품입니다.

 

이 글을 검색해서 찾아오셨다면 이미 본인에게 필요한 그래픽카드가 무엇인지 생각하고 왔거나, 자신이 사용하려는 용도에 적합한지 알아보기 위해 온 것일 거라고 생각합니다.

 

 

 

 

 

RTX A4000은 현 시점 암페어 아키텍쳐(지포스 RTX 30에 대응)를 사용하는 워크스테이션용 그래픽카드 중 LP(Low Profile) 규격을 제외하면 가장 저렴한 가격에 만날 수 있는 제품입니다.

 

이전 세대까지는 쿼드로(QUADRO)라는 이름이었지만, 현재는 테슬라와 함께 브랜드 네임을 폐지하고 RTX A라는 통합된 이름을 사용합니다.

 

RTX A4000의 국내 정식 발매가는 1,474,000 원으로, 발주는 #리더스시스템즈에 문의하시면 됩니다.

 

국내 정식 유통 제품은 엔비디아 정품 보증 카드가 제공되며, 시리얼 넘버 기반으로 관리되므로 사후 지원이 필요한 경우 국내에 정식으로 유통된 제품을 사는 것을 권장합니다.

 

사실 환율과 배송비를 고려하면 해외에서 구매해도 딱히 메리트가 없는 편이고, 미국을 제외하면 오히려 한국 정식 발매가보다 더 비싸게 파는 나라도 많습니다.

 

 

 

사양

 

출처 : 엔비디아 홈페이지

 

※ '열처리 활성' 은 Active Cooling 즉 패시브 히트싱크가 아닌 블로워를 사용함을, 'VR 지원 확장 가능' 은 VR 사용이 가능하다는 의미입니다.

 

 

 

외관

 

박스 뒷면에도 시리얼 넘버가 기재되어있습니다.

 

지포스 기준 RTX 20(튜링 아키텍쳐)에 대응되는 쿼드로 RTX 부터는 벤더를 따로 표기하지 않고 엔비디아 상표를 사용하지만, 아마도 유통 구조상 리드텍 제품일 것으로 추정하고 있습니다.

 

 

구성품은 그래픽카드, 정품 보증 카드, HDMI-DP 젠더, 간단한 사용설명서, 보증 안내문으로 심플한 편입니다.

 

그래픽카드 본품은 따로 정전기 방지 비닐에 포장이 되어있지는 않지만 박스 내부에 완충 처리는 잘 되어있는 편입니다.

 

 

소비자용 그래픽카드인 지포스와 달리, 워크스테이션용 그래픽카드는 기본적으로 감상을 목적으로 하지 않기 때문에 외관상으로 투박한 형태를 하고 있는 경우가 많았으나, 이번 세대 제품들은 검은색과 금색을 띄는 반유광 처리된 금속성 질감의 소재를 사용하여 꽤 고급스러운 인상을 줍니다.

 

지문이 묻기 쉬운 소재이니 깨끗한 상태를 유지하고 싶다면 주의를 요합니다.

 

 

흔히 워크스테이션용 그래픽카드에서 사용되어온 하단에서만 흡기하는 방식이 아닌, 상단에서도 흡기하는 특이한 방식의 쿨러가 적용되었습니다.

 

이는 현 세대 최상위 워크스테이션용 그래픽카드인 RTX A6000과 유사하지만, RTX A6000과는 달리 기판 상단을 직접 냉각하는 방식은 아니라는 점에서 차이가 있습니다.

 

RTX A6000의 상단부, 출처 Develop3D

이러한 구조로 인해 라이저 케이블을 사용해 세우거나, 사제 백플레이트를 장착하지 않아도 꽤 멋진 외관을 보여줍니다.

 

RTX A5000의 상단부, 출처 AECMAGAZINE

RTX A5000은 상기 두 제품과 달리 일반적인 듀얼 슬롯 블로워를 사용하여 외관상으로 이전 세대 제품들과 차별화가 이루어지지는 못했습니다.

 

 

RTX A4000에는 DisplayPort 단자 4개가 있으며, HDMI 단자만 사용할 수 있는 모니터를 사용하는 경우 구성품에 포함된 젠더를 사용하면 됩니다.

 

냉각의 경우 DisplayPort 단자 아래의 작은 열 배출구와 하단의 송풍구로 열을 내보내는 형태로, 일반적인 히트파이프 + 팬을 사용하는 소비자용 그래픽카드나 듀얼 슬롯 블로워와 더 넓은 송풍구가 있는 상위 등급의 워크스테이션용 그래픽카드에 비하면 발열 해소에 불리한 구조로, 온도 역시 높은 편입니다. (열 배출 자체는 문제가 없습니다만 그래픽카드 아래에 있는 PCI 슬롯 커버까지 뜨거워질 정도입니다)

 

물론 워크스테이션용 그래픽카드의 작동 보증 온도는 소비자용 그래픽카드인 지포스에 비해 널널한 편이므로, 정상적인 용도로 사용한다면 온도로 인해 문제가 생길 일은 없을 것입니다.

 

이전 세대 싱글 슬롯 쿼드로의 경우 약 105 ℃ 까지 작동을 보증한 사례가 있습니다.

 

 

 

측정

 

소음

 

소음 측정 결과는 블로워 방식의 쿨러는 매우 시끄러울 것이라는 예상과 달랐습니다.

 

흔히 블로워 방식의 쿨러의 소음을 극단적으로 비유하면 진공청소기 소리에 빗대는데, RTX A4000의 소음은 물이 수도관을 타고 흘러가는 소리와 유사했습니다.

 

풀로드 상태에서의 소음은 PC 본체의 측판이 개방된 상태로 10cm 거리에서 46데시벨 정도로 측정되었고, PC 본체를 책상 아래에 두고 사용하는 것을 기준으로 사용자의 머리 높이에서 측정한 결과 30데시벨 정도로 소음 때문에 사용에 지장이 생길 것이라는 생각은 할 수 없었습니다.

 

물론 전문적인 장비를 사용하여 측정한 것은 아니나, 싱글 슬롯 블로워 쿨러라는 것을 감안하면 어쨌든 준수한 결과입니다.

 

 

성능

 

 

3DMark.com search

3DMark.com search

www.3dmark.com

지포스 제품군에서는 성능 지표라 할 수 있는 3DMark 벤치마크 결과입니다.

 

오버클럭 없이 진행된 벤치마크라고는 하나, RTX 3070 Ti와 같은 GA104 풀칩을 사용했음에도 RTX 3060과 RTX 3060 Ti의 사이 어딘가에 있는 애매한 성능을 보여줍니다.

 

 

3DMark.com search

3DMark.com search

www.3dmark.com

RTX 3060 Ti

 

 

3DMark.com search

3DMark.com search

www.3dmark.com

RTX 3060

 

하지만 RTX A4000은 애초에 게임을 위해 만들어진 제품이 아니기 때문에 납득할 수 있는 결과입니다.

 

RTX A4000은 이전 세대의 쿼드로 제품군에 해당하는 제품이며, 전원 공급 단자는 PCIe 6핀으로 TGP는 140W 제한이 걸려있기 때문에, PCIe 8핀으로 170W+α의 전력을 공급받는 RTX  3060이나 200W+α의 전력을 공급받는 RTX 3060 Ti와 비교하면 오히려 전력 대비 성능은 더 좋다고 볼 수 있습니다.

 

어쨌거나, 게임이나 매체의 소모를 목적으로 워크스테이션용 그래픽카드를 구매하는 것은 그다지 경제적이지는 않습니다.

 

 

워크스테이션 그래픽카드(이전 쿼드로 제품군)의 성능을 측정하는데 가장 적합한 SPECviewperf 2020 V2(FHD)와 SPECviewperf 13의 벤치마크 결과입니다.

 

대형 벤더에서 제조한 워크스테이션에 장착된 다른 워크스테이션용 그래픽카드의 성능을 측정한 결과는 아래 링크를 참조하면 되겠습니다.

 

SPECviewperf 2020 Results Overview

 

www.spec.org

 

SPECviewperf 13 Results Overview

 

www.spec.org

 

 

물론 RTX A4000은 궁극의 워크스테이션용 그래픽카드는 아닙니다.

 

NVLink를 지원하지 않고, vGPU 역시 지원하지 않는다는 제약이 있으므로 이 기능들을 필요로 하는 경우 상위 제품 또는 구 세대 동급 제품보다 상위 등급의 구 세대 제품을 고려해야 합니다.

 

다만 상술한 기능을 필요로 하는 경우 대형 벤더가 제조하는 고가의 완제품 워크스테이션을 구매하는 경우가 대부분이고, RTX A4000을 고려하는 잠재적 구매자들은 상대적으로 저렴한 가격에 구매 가능한 워크스테이션용 그래픽카드를 찾고 있는 경우가 많을 것이기 때문에 다른 장점을 보고 구매할 이유가 있습니다.

 

 

 

RTX A4000의 장점

 

높은 배정밀도(FP64) 연산 능력

 

RTX A4000은 동일한 GA104 풀칩을 사용하는 지포스 RTX 3070 Ti (339.8 GFLOPS)보다 더 높은 배정밀도 연산 능력(599.0 GFLOPS)을 가지고 있습니다.

 

이는 상위 칩셋인 GA102 풀칩을 사용하는 RTX 3090 (556.0 GFLOPS)보다도 높은 수치입니다.

 

이 때문에 메모리 대역폭과 코어 자체의 성능이 전부인 딥러닝 등의 분야보다는 수치 해석 등의 분야에서 지포스보다 뛰어난 성능을 보여줄 수 있습니다.

 

 

PLM 사용 시 높은 성능

SPECviewperf 13 벤치마크 결과 비교표

PLM 사용 시에는 같은 세대에서 더 고가의 지포스보다도 뛰어난 성능을 보여줍니다.

 

워크스테이션용 그래픽카드를 위한 전용 드라이버를 사용하여 소비자용 그래픽카드에서 제한되는 기능을 사용할 수 있기 때문인데, 이것이 타이탄을 제외한 소비자용 그래픽카드의 가장 큰 차이점이라고 할 수 있습니다.

 

 

ECC 지원

 

이전 세대의 쿼드로 4000번대 그래픽카드들이 ECC를 지원하지 않았던 반면에, RTX A4000은 ECC를 지원합니다.

 

사실 워크스테이션에서는 주로 ECC RAM을 채용하고, 대부분의 오류는 RAM에서 걸러지기 때문에 그래픽카드로 인한 오류가 발생할 확률이 그렇게 높지는 않습니다.

 

그럼에도 ECC VRAM을 탑재했다는 것은 한 번의 오류로 막대한 손실을 입을 수 있는 미션 크리티컬 작업에서의 예기치 못한 데이터 손실을 방지할 수 있음을 의미합니다.

 

출고 상태에서는 ECC가 꺼져있는 상태로, ECC를 사용하기 위해서는 엔비디아 제어판에서 ECC를 켜줘야 합니다.

 

ECC를 사용하는 경우 VRAM 중 1GB를 ECC를 위해 사용하므로 실제 사용 가능한 VRAM의 용량은 15GB가 됩니다.

 

 

이전 세대 대비 두 배의 VRAM 용량

이전 세대 동급 제품인 쿼드로 RTX 4000이 8GB의 VRAM을 제공하는 반면, RTX A4000은 16GB의 VRAM(ECC 적용 시 15GB)을 제공합니다.

 

RTX 3090 을 제외한 현 세대 모든 소비자용 그래픽카드보다 높은 수준의 VRAM 용량으로, 혼합 정밀도를 사용하는 경우 현존하는 모든 딥러닝 모델을 적용할 수 있습니다.

 

 

낮은 전력 소비량

RTX 4000

이전 세대 동급 제품인 RTX 4000이 최대 160W의 전력을 소비하는 반면, RTX A4000은 140W의 더 낮은 전력 소비에도 불구하고 더 높은 성능을 보여줍니다.

 

동급이라 할 수 있는 지포스 제품들인 RTX 3060과 RTX 3060 Ti와 비교해도 최대 전력 소비량이 더 낮습니다.

 

권장되는 파워서플라이의 정격출력도 300W 수준으로 심각한 뻥파워를 사용하지 않는 이상 출력을 걱정할 필요는 없는 수준입니다.

 

 

작은 크기

 

가로 241mm, 세로 112mm, 싱글 슬롯 사이즈로 물리적인 호환성이 뛰어납니다.

 

한 개의 PCI 슬롯 만을 사용하기 때문에(Single-slot) 거대한 공랭 쿨러 또는 다른 PCIe 장치와 함께 사용하거나, SFF(Small Form Factor) 규격의 작은 크기의 PC에 장착하는 경우에도 물리적인 제약이 적습니다.

 

 

위와 같은 장점들이 있기 때문에, 사용하고자 하는 목적만 적합하다면 RTX A4000은 그다지 비싸지 않은 비용으로 고성능 워크스테이션을 구성할 수 있는 훌륭한 제품이라고 할 수 있습니다.

 

 

RTX A4000을 사용하기에 적합한 분야를 요약하면 다음과 같습니다.

 

 

1. 수치 해석

 

2. PLM

 

3. 저예산, 저전력과 소형화를 요하는 워크스테이션 계획

 

 

 

 

 

 

 

기타

 

RTX A4000은 PCIe 버전/레인 수에 따른 성능 차이가 거의 없습니다.

 

PCIe 4.0 x16 - FHD
PCIe 4.0 x8 - FHD
PCIe 3.0 x16 - FHD

FHD 환경에서 PCIe 대역폭만 반으로 줄이고 같은 조건에서 성능을 측정한 결과 오차 범위 내라 할 수 있는 차이가 있었을 뿐, 극적인 성능 감소는 없었습니다.

 

 

PCIe 4.0 x16 - 4K
PCIe 4.0 x8 - 4K
PCIe 3.0 x16 - 4K

4K 환경에서의 측정 역시 크게 다를 바 없는 결과를 보였습니다.

 

 

 

 

 

 

 

+ 사족

 

유튜브 댓글란의 한 외국인의 요청에 의해서 채굴 성능도 테스트 해봤는데, 스파이웨어로 인식해서 한참 걸렸습니다.

 

이더리움 채굴 시 아무 것도 안 건드리면 대충 50MH/s 정도 나옵니다.

 

언더볼팅하고 메모리 오버클럭 하면 더 잘 나온다고 하긴 하지만 저는 이 제품을 채굴 목적으로 사용하려고 구매한 것이 아니기 때문에 그런 세세한 것까지 테스트 해 볼 여유가 없으므로, 그냥 이 정도 나온다 생각하고 참고만 하시면 되겠습니다.

 

현 시점 채굴업자들이 쓸어가는 RTX 3060 Ti가 RTX A4000보다 매입가도 싸고 성능 자체도 더 잘 나오는 것으로 압니다.

 

 

++ 사족2

 

쿨러 나사 간격은 오차가 있을 수 있으나 가로 세로 모두 54~55mm로 측정됩니다.

 

히트파이프 + 팬 형태로 개조하려는 분이 있다면 이전 세대 지포스 쿨러들과 호환이 되지 않을 가능성이 높습니다.

 

또한 그래픽카드를 임의로 분해 시 보증이 무효화 될 수 있다는 점도 참고하시면 좋을 것 같습니다.

 

 

 

 

 

 

 

 

외부 이미지 출처

엔비디아코리아

Develop3D

AECMAGAZINE