메타(Meta)가 데이터센터 인프라에 새로운 메모리 재사용 솔루션을 채택했다고 발표했습니다. 자체 개발한 맞춤형 칩 "Vistara"를 통해 폐기된 서버의 DDR4 메모리 스틱을 DDR5 메모리를 사용하는 차세대 서버에 연결하여 높은 글로벌 하드웨어 가격과 장기적인 메모리 부족 상황에서 비용 절감과 리소스 재사용을 달성할 것입니다.

메모리 및 기타 하드웨어 부품의 글로벌 가격은 지난 기간 동안 계속해서 상승했습니다. 엄청난 구매력을 지닌 대규모 기술 기업조차 자본 지출을 통제할 수 있는 보다 효율적인 방법을 모색하기 시작했습니다. Meta의 접근 방식은 이러한 환경에서의 시도입니다.

Meta의 현재 운영 및 유지 관리 주기에 따르면 서버는 일반적으로 3~5년마다 교체되지만, 서버에 포함된 메모리 모듈의 실제 수명은 일반적으로 7~10년에 이릅니다. 이로 인해 서버가 폐기되면 여전히 온전하고 사용 가능한 DDR4 메모리 모듈을 오프라인으로 전환해야 하므로 많은 낭비가 발생합니다. 이러한 "수명 불일치" 문제를 해결하기 위해 Meta는 기존 메모리가 새로운 플랫폼에서 계속 서비스를 제공할 수 있도록 Vistara 칩을 설계하여 하드웨어 수명 주기를 연장하고 전체 TCO를 최적화했습니다.

업계 컨퍼런스 ISCA에 공개된 기술 문서 정보에 따르면 Vistara는 CXL 2.0/1.1 인터페이스를 통해 DDR4 메모리를 PCIe Gen5 x16 버스의 차세대 프로세서에 연결하는 맞춤형 ASIC 칩입니다. 특정 배포에서 Meta는 폐기된 서버에서 DDR4 메모리 스틱을 제거하고 내부적으로 "MemServer"라고 알려진 특수 장치에 설치합니다. 각 MemServer는 약 768GB의 DDR5 메모리와 약 256GB의 재활용 DDR4 메모리로 구성됩니다. 운영 체제는 이러한 DDR4를 추가 메모리 노드로 처리합니다. 기본 DDR5 리소스가 부족해지면 시스템은 이 확장된 메모리를 예약하고 사용할 수 있습니다.

Meta는 시중에 나와 있는 일반적인 CXL 인터페이스가 일반적으로 자체 메모리로 컨트롤러를 패키징하여 다른 소스에서 폐기된 DDR4 슬라이버를 삽입하기 어렵기 때문에 기성 CXL 하드웨어 솔루션은 이러한 요구를 충족할 수 없다고 말했습니다. Vistara의 설계는 컨트롤러를 메모리에서 의도적으로 분리하여 컨트롤러가 독립적으로 존재할 수 있도록 함으로써 Meta가 매우 유연한 메모리 재사용 아키텍처를 달성하기 위해 필요에 따라 기존 DDR4 메모리 리소스를 삽입할 수 있도록 합니다.

규모 수준에서 Meta는 이 새로운 아키텍처를 수백만 대의 서버, 특히 인공 지능 비즈니스를 지원하는 데이터 센터로 구성된 하이퍼스케일 인프라에 배포할 계획입니다. 회사가 Muse Spark와 같은 추론 및 다중 모드 기능을 갖춘 새로운 모델의 광범위한 배포를 포함하여 생성 AI와 같은 영역에 계속 투자함에 따라 이러한 AI 데이터 센터의 메모리 및 컴퓨팅 성능 요구 사항은 계속해서 증가하고 있습니다. DDR4 메모리를 재사용해 성능을 보장하면서도 전체적인 효율성을 높일 수 있을 것으로 기대된다.

Meta는 "재생된" 메모리에 전적으로 의존하지 않으며 새로 구입한 DDR5 및 기타 하드웨어는 여전히 인프라에서 중요한 역할을 한다는 점에 유의해야 합니다. 그러나 초대형 데이터 센터 시나리오에서는 워크로드의 일부에 재사용된 DDR4 메모리 모듈을 사용하더라도 장기 운영에서 상당한 비용 절감을 가져오고 하드웨어 폐기로 인한 리소스 낭비를 줄이는 데 충분합니다.