그래픽 카드 비교 방법: 가장 중요한 GPU 사양
그래픽 카드의 VRAM GB 수 외에도, 그래픽 카드를 구매할 때 올바른 결정을 내리기 위해 알아야 할 GPU 사양이 많이 있습니다. 이 가이드에서는 그래픽 카드를 비교하는 데 도움이 되는 가장 중요한 GPU 사양을 설명합니다.
GPU 다이
GPU와 그래픽 카드라는 용어를 동의어로 사용하지만, 기술적으로 같은 것은 아닙니다. 일반적인 그래픽 카드에는 내부에 GPU 다이가 있고, PCB에 납땜되어 있으며, 그 주변에 메모리 모듈이 있습니다. 그런 다음 히트싱크, 덮개, 팬으로 둘러싸여 그래픽 카드라고 부르는 것을 만듭니다. AMD와 Nvidia와 같은 회사는 세대마다 몇 가지 다른 GPU 다이를 사용하여 여러 WeU를 만든 다음 필요에 따라 다이의 사양을 조정하고 줄입니다.
GPU 다이는 일반적으로 사양서의 이름에서 숫자가 낮을수록 다이가 더 크고 강력하다는 방식으로 명명됩니다. 예를 들어, Nvidia의 AD102 GPU는 플래그십 RTX 4090에 사용되는 반면 RTX 4080 및 RTX 4080 Super는 AD103 GPU를 사용합니다. 최신 GPU는 일반적으로 더 작은 제조 공정을 사용하여 동일한 물리적 영역에 더 많은 전력이 포장됩니다.
GPU 코어
GPU의 컴퓨트 유닛은 일반적으로 “코어”라고 부르는 것입니다. 이 명명법은 오해의 소지가 있는데, GPU의 코어는 CPU의 실제 코어와 다르기 때문입니다. GPU는 수천 개의 작은 코어 또는 처리 요소를 클러스터로 그룹화한 다음 컴퓨트 유닛으로 그룹화합니다. 이러한 컴퓨트 유닛은 모든 GPU 제조업체가 컴퓨트 유닛(AMD), Xe-코어(Intel), 스트림 멀티프로세서(Nvidia) 등 다른 이름으로 부르는 것입니다.
CUDA 코어에 대한 마케팅이 많이 있었습니다. 이것들은 실제로 컴퓨트 유닛을 구성하는 처리 요소입니다. 따라서 CPU의 코어와 비슷한 것으로 착각하지 마십시오. CUDA 코어와 같은 범용 처리 요소 외에도 GPU는 레이 트레이싱 코어와 텐서 코어와 같은 특수한 요소를 가질 수 있습니다. (AMD와 Intel은 다른 이름을 사용할 수 있습니다.)
더 빠른 GPU는 느린 모델보다 더 많은 CUDA 코어(Nvidia) 또는 스트리밍 프로세서(AMD)를 갖지만, 이러한 사양을 제조업체와 세대 간에 비교할 수는 없습니다. 이는 동일한 제조업체의 동일한 세대의 다양한 그래픽 카드 모델을 비교할 때만 도움이 됩니다.
메모리: VRAM 및 대역폭
GPU VRAM은 거의 모든 PC 사용자에게 친숙한 것입니다. VRAM 또는 비디오 RAM은 프레임버퍼, 텍스처 정보 및 기타 그래픽 정보를 수용하는 데 사용할 수 있는 그래픽 카드의 메모리입니다. 게임 내 설정과 비디오 해상도가 GPU의 모든 VRAM을 사용하는 경우 GPU 아티팩팅 및 성능 저하가 발생할 수 있습니다.
크기 외에도 다른 중요한 메모리 사양이 있습니다. 예를 들어, 메모리 유형(GDDR6, GDDR6X 등)은 GPU 메모리의 속도와 전력 효율성을 결정합니다. 메모리 버스 폭(384비트, 256비트, 128비트 등)은 GPU와 메모리 간에 데이터를 얼마나 빨리 전송할 수 있는지 결정합니다. 메모리 속도와 버스 폭은 그래픽 카드의 메모리 대역폭(GB/s)을 결정합니다.
클록 속도
CPU와 마찬가지로 GPU도 GPU 코어와 메모리 모두에 대한 클럭 속도가 있습니다. 코어 클럭은 GPU가 명령을 처리할 수 있는 속도이고 메모리 클럭은 메모리(VRAM)가 GPU와 데이터를 주고받을 수 있는 속도입니다. 일반적으로 그래픽 카드의 코어 클럭과 메모리 클럭이 높을수록 성능이 높아집니다.
메모리 클록은 GPU의 효과적인 메모리 속도(Gbps)를 결정하는 데에도 역할을 합니다. 이 메트릭은 버스 폭과 결합되어 GPU의 최대 대역폭을 계산할 수 있습니다. 심지어 코어 클록과 메모리 클록을 변경할 수도 있는데, 이는 그래픽 카드를 오버클러킹하는 것과 같습니다.
전체 그래픽 파워(TGP)
CPU에 최대 전력 소모를 나타내는 TDP(Thermal Design Power)가 있는 것처럼 GPU에는 TGP(Total Graphics Power)가 있습니다. TGP는 그래픽 카드가 일반적인 사용 중에 소비할 수 있는 최대 전력량을 나타내며 와트로 측정됩니다. 예를 들어, RTX 4090은 450W로 평가되어 일반적으로 소비하는 최대 전력량입니다. 순간적인 스파이크는 전력 소모를 TGP를 넘어설 수 있지만, 이는 마이크로초 동안 지속됩니다.
TGP는 그래픽 카드가 얼마나 많은 전력을 소모하는지를 나타내는 지표일 뿐만 아니라 게임이나 기타 GPU 집약적 작업을 실행할 때 예상할 수 있는 GPU 온도에 대해서도 알려줍니다. 150W 이상을 소모하지 않는 저가형 또는 로우엔드 GPU는 전력을 더 많이 소모하는 그래픽 카드만큼 뜨거워지지 않을 수 있습니다.
FP32 성능
FP32(또는 부동 소수점 단정밀도)는 GPU의 이론적 성능을 측정하는 수학적 방법입니다. 성능에 관련된 모든 것을 포괄하지는 않지만, 세대를 넘어서도 다양한 GPU를 비교할 때 유용할 수 있습니다. GPU가 1초에 수행할 수 있는 부동 소수점 연산 수를 나타내며 TFLOPS로 측정합니다. 여기서 1TFLOP는 초당 1조 개의 연산과 같습니다.
예를 들어, 새로운 RTX 4070 Super를 RTX 2070 Super와 비교한다면, 4070 Super는 35.48 TFLOPS인 반면 2070 Super는 9.06 TFLOPS입니다. 이 숫자가 4배 더 증가한 것처럼 보이지만, 4070 Super는 2070 Super보다 약 2배 더 강력할 뿐입니다. 따라서 FP32는 포괄적이지는 않지만 GPU 성능에 대한 일반적인 아이디어가 필요할 때 여전히 유용한 지표입니다.
기타 사양
위에 표시된 사양은 GPU를 비교할 때 가장 중요하지만 구매 결정을 내릴 때 도움이 될 수 있는 다른 사양도 있습니다.
예를 들어, GPU가 지원하는 PCIe 세대는 더 높은 이론적 대역폭으로 변환됩니다. 이는 오늘날 게임 성능에는 영향을 미치지 않을 수 있지만 미래에는 영향을 미칠 수 있습니다. 또 다른 중요한 측면은 DirectX, Vulkan 및 OpenGL과 같은 그래픽 API에 대한 지원입니다. 거의 모든 최신 GPU는 이러한 각각을 지원하므로 이는 정말 오래된 GPU와 최신 GPU를 비교할 때만 도움이 될 수 있습니다.
마지막으로, 그래픽 카드가 지원하는 소프트웨어 기능은 귀하의 결정을 내리거나 망칠 수 있습니다. Nvidia의 DLSS, AMD의 FSR, Intel의 XeSS 업스케일링 기술은 성능과 게임 지원이 다르므로 구매하기 전에 GPU가 지원하는 업스케일링 기술(및 버전)을 확인하세요.
일부 소프트웨어 기능은 하드웨어 제한이 있습니다. 예를 들어, 게임에서 프레임 속도를 높이는 Nvidia의 Frame Generation 기술이 있습니다. 현재 RTX 4000 시리즈 GPU만 지원합니다. 투자하는 GPU 세대로 인해 주요 기능을 놓치지 않도록 하세요.
프로세스에 뛰어들면 수많은 GPU 사양을 접할 수 있습니다. 항상 평판이 좋은 매체와 제작자의 실제 리뷰와 벤치마크를 확인하여 결정을 내리세요. 실행하려는 게임과 애플리케이션에서 선택한 GPU의 성능 수치를 확인하세요. Reddit 게시물, YouTube 벤치마크, 신뢰할 수 있는 온라인 출판사의 리뷰를 참조하세요. 게임용 PC를 빌드할 때는 항상 고려해야 할 사항이 많으므로 시간을 들여 서둘러 하지 마세요.
이미지 출처: Unsplash
답글 남기기