'에이전트 AI(Agentic AI)'로 대표되는 새로운 인공지능 물결 속에 통합 메모리 아키텍처(UMA)가 PC와 컴퓨팅 분야에서 급속도로 가열되고 있다. AMD는 이것이 중요한 기회일 뿐만 아니라 미래 제품 아키텍처 및 로드맵의 핵심 방향이라고 믿습니다.

소위 통합 메모리 아키텍처는 CPU, GPU 및 메모리를 동일한 시스템 칩(SoC)에 긴밀하게 결합하여 공유 대용량 메모리 풀을 형성하는 것을 의미하며, 이는 기존의 "시스템 메모리 + 독립 비디오 메모리" 분리 모델 대신 시스템 부하에 따라 CPU와 GPU 간에 동적으로 할당됩니다. AI 워크로드, 특히 대규모 모델 추론에서 이 설계는 데이터 복사 및 대역폭 병목 현상을 크게 줄일 수 있으므로 점차 AI 터미널 및 새로운 형태의 PC를 위한 주류 솔루션 중 하나로 자리잡고 있습니다.
AMD Ryzen AI MAX 시리즈의 출시와 NVIDIA RTX Spark 및 기타 제품의 추가로 통합 메모리 아키텍처는 AI 터미널 플랫폼의 공통 기술 초석이 되었습니다. AMD는 1세대 Ryzen AI MAX 솔루션이 최대 128GB의 메모리를 제공할 수 있으며, 이 중 최대 112GB의 시스템 메모리를 GPU용으로 분할할 수 있다고 밝혔습니다. NVIDIA RTX Spark도 유사한 아이디어를 사용하여 워크로드에 따라 CPU와 GPU 간에 메모리를 동적으로 할당하므로 통합 메모리 아키텍처가 일반 컴퓨팅부터 AI 추론까지 광범위한 애플리케이션 시나리오를 포괄할 수 있습니다.
언론과의 인터뷰에서 AMD 부사장 David McAfee는 앞으로 더 많은 제품이 UMA 솔루션을 사용할 것인지에 대한 질문을 받았습니다. 그는 통합 메모리 시스템에 대한 관심이 계속 높아질 것이며 업계는 이러한 시스템을 중심으로 "적절한 아키텍처 형태"를 탐색하고 기존 플랫폼을 기반으로 계속 반복하고 개선할 것이라고 답했습니다. 그는 이것이 제품 선택, 도로 계획 및 배포 형태에서 AMD에 "완전한 가능성의 세계"를 열어줄 새로운 유형의 워크로드 및 컴퓨팅 공간이라고 강조했습니다.
AMD는 통합 메모리 사고를 차세대 제품인 Ryzen AI MAX 400 시리즈로 확장했습니다. 공식 소개에 따르면, 이 세대의 제품은 최대 192GB의 통합 메모리를 지원할 수 있으며, GPU에 최대 160GB를 할당할 수 있습니다. 이를 통해 3000억 개가 넘는 매개변수 규모의 LLM(대형 언어 모델)을 로컬에서 실행하여 복잡한 AI 워크플로우와 고급 크리에이티브 워크로드의 메모리 용량과 대역폭에 대한 극단적인 수요를 충족할 수 있습니다.

미디어 라운드테이블에서 기자는 향후 게임용 UMA Ryzen 프로세서를 볼 수 있는지, 아니면 더 긴밀한 통합과 저지연 패키지 메모리를 통해 UMA 기능을 더욱 향상시키기 위해 "Strix Halo + 3D V-Cache / 패키지 수준 고대역폭 메모리"와 유사한 설계를 볼 수 있는지 질문했습니다. McAfee는 현재 "구체적인 답변이 없다"고 말했지만 Strix Halo와 같은 플랫폼이 Nvidia와 동일한 트랙에 진입하고 있음을 반복했습니다. 이는 UMA를 중심으로 한 시스템 설계가 향후 몇 년 내에 더 많은 리소스 투자와 아키텍처 탐색을 받게 될 것임을 의미합니다.
McAfee가 UMA에 대해 이야기할 때 모바일 및 AI 단말기뿐만 아니라 고성능 데스크톱 시스템도 언급했다는 점은 주목할 가치가 있습니다. 그는 통합 메모리 아키텍처의 지원 기능이 지속적으로 개선되고 더 많은 생태학적 참가자가 이 아키텍처를 채택하면 고성능 데스크탑과 통합 시스템 형태의 전반적인 진화가 촉진되고 "고성능 PC + 통합 메모리"에 대한 업계의 이해가 재편될 것이라고 믿습니다. 그의 견해에 따르면 Halo와 같은 플랫폼에서 채택한 통합 아키텍처는 여전히 이러한 유형의 시스템의 "올바른 형태"이며 Nvidia의 최근 관련 릴리스는 이러한 아키텍처 경로를 "승인"한 것으로 간주될 수 있습니다.
McAfee는 또한 Agentic Compute의 등장으로 통합 메모리 풀을 통해 엔드포인트에서 "매우 큰 모델"을 실행하는 것이 이러한 시스템의 고유한 가치 제안 중 하나가 되었다고 강조했습니다. AMD의 경우 이러한 유형의 통합 시스템은 전체 제품 포트폴리오에서 이중 역할을 합니다. 한편으로는 최첨단 AI 및 대규모 모델 워크로드를 지원하고 다른 한편으로는 고성능 데스크탑 및 고급 크리에이티브 워크스테이션을 위한 기본 플랫폼 형태가 될 수도 있습니다.
업계 관점에서 볼 때 통합 메모리 아키텍처는 더 이상 틈새 실험이 아니며 차세대 컴퓨팅 플랫폼의 기본 기둥으로 빠르게 발전했습니다. 대용량 공유 메모리 풀에 대한 Agentic AI의 수요가 계속 증가함에 따라 AMD 및 NVIDIA와 같은 제조업체는 UMA에 공동으로 투자했으며 이는 이 아키텍처 경로가 업계 수준에서 강력한 지지를 받았다는 의미이기도 합니다. Ryzen AI MAX 400과 같은 새로운 플랫폼에 대한 AMD의 적극적인 계획과 Strix Halo와 같은 고성능 플랫폼의 미래 형태에 대한 열린 태도는 아직 통합 메모리 아키텍처 개발의 시작점에 불과하다는 것을 보여줍니다.
CPU, GPU, 메모리 간의 경계가 점차 흐려지는 통합 시스템에서 차세대 플랫폼은 성능, 에너지 효율성 및 기능 경계에서 동시에 도약을 달성할 것으로 예상됩니다. 이는 AI 및 대형 모델 워크로드에만 적용 가능한 것이 아니라 게임, 하이엔드 데스크톱 분야에도 확장될 수 있습니다. AMD의 경우 통합 메모리 아키텍처는 차세대 제품 아키텍처 설계와 중장기 도로 계획의 핵심 기반 중 하나로 자리잡고 있으며 전체 생태계는 이제 막 이 경로의 시작 단계에 들어섰습니다.