어제 Arm은 "전체 설계" 계획에서 상당한 진전을 발표했습니다. 1년 전에 시작된 이 프로그램은 업계 파트너 간의 협력을 촉진하여 데이터 센터용 맞춤형 칩 개발을 가속화하는 것을 목표로 합니다. 최근 AlcorMicro, Egis, PUFSecurity 및 SEMIFIVE가 추가되면서 생태계는 약 30개 참여 기업을 포함하도록 성장했습니다.
주목할만한 발전은 Arm, Samsung Foundry, AD Technology 및 Rebellions가 협력하여 인공 지능 CPU 칩 플랫폼을 만들었다는 것입니다. 이번 협력의 목표는 삼성 파운드리의 2nm GAA(Gate-All-Around) FET 기술을 사용하여 구현된 Rebellions의 AI 가속기와 AD Technology의 컴퓨팅 칩을 결합하여 클라우드, HPC 및 AI/ML 워크로드용 솔루션을 제공하는 것입니다.
이 플랫폼은 생성 인공 지능 워크로드에 상당한 효율성 향상을 가져올 것으로 예상되며, 4,050억 개의 매개변수를 갖춘 Llama3.1과 같은 LLM의 경우 효율성이 표준 CPU 설계보다 2~3배 더 높을 것으로 추정됩니다.
Arm의 접근 방식은 데이터 전처리, 오케스트레이션, 검색 증강 생성(RAG)과 같은 고급 기술을 포함하여 전체 AI 스택을 지원하는 데 있어 CPU 컴퓨팅의 중요성을 강조합니다. 회사의 컴퓨팅 하위 시스템(CSS)은 이러한 요구 사항을 충족하도록 설계되어 파트너가 다양한 칩셋 솔루션을 구축할 수 있는 기반을 제공합니다.
AlcorMicro 및 Alphawave를 포함한 여러 회사는 다양한 인공 지능 및 고성능 컴퓨팅 애플리케이션을 위한 CSS 기반 칩을 개발할 계획을 발표했습니다. 또한 이 프로그램은 소프트웨어 준비에 중점을 두어 주요 프레임워크와 운영 체제가 Arm 기반 시스템과 호환되는지 확인합니다. 최근 노력에는 PyTorch 및 Llama.cpp와 같은 오픈 소스 프로젝트에 대한 CPU 기반 추론을 최적화하는 ArmKleidi 기술 도입이 포함됩니다.
Google이 주장하는 것처럼 대부분의 AI 작업 부하가 CPU에서 추론되므로 AI를 위해 가장 효율적이고 성능이 뛰어난 CPU를 구축하는 것이 합리적이라는 점은 주목할 가치가 있습니다.