Amazon은 NVIDIA와 손을 잡고 기업과 정부의 주권 데이터 요구 사항을 충족하기 위해 로컬 "AI 공장"을 시작합니다

아마존의 클라우드 컴퓨팅 플랫폼 AWS는 대기업과 정부 기관이 자체 데이터센터에서 아마존의 인공지능 시스템을 운영할 수 있게 해주는 'AI 팩토리'라는 신제품 출시를 화요일 발표했다. 고객은 컴퓨터실과 전력을 제공하고, AWS는 전체 AI 인프라 배포와 통합 운영 및 유지 관리를 담당합니다. 기존 AWS 클라우드 서비스와도 연결할 수 있습니다.

이 모델은 데이터 주권에 극도로 민감하고 데이터를 제3자 모델 제공업체에 업로드하거나 기본 하드웨어 리소스를 다른 사람과 공유할 필요가 없기를 바라는 조직을 대상으로 합니다.

신제품 이름에 포함된 'AI 팩토리' 개념은 엔비디아의 기존 동명 하드웨어 시스템에서 따온 것으로, GPU 칩, 네트워크 장비 등 대형 모델을 실행하는 데 필요한 전체 구성요소 세트를 통합한다. AWS의 AI 팩토리는 사실 엔비디아와의 심층적인 협력 프로젝트다. 두 회사는 이 솔루션이 양 당사자의 기술적 역량을 결합하여 고객에게 통합된 AI 컴퓨팅 성능과 플랫폼 스택을 제공할 것임을 확인했습니다.

특정 구성 측면에서 기업은 NVIDIA의 최신 세대 Blackwell GPU를 설치하거나 Amazon이 자체 개발한 새로운 Trainium3 트레이닝 칩을 사용하여 다양한 컴퓨팅 성능 및 비용 요구 사항을 충족하도록 선택할 수 있습니다. 컴퓨팅 성능 외에도 시스템은 AWS의 자체 네트워크, 스토리지, 데이터베이스 및 보안 구성 요소를 통합하고 모델 선택 및 호스팅 서비스인 Amazon Bedrock과 모델 구성 및 교육 플랫폼인 SageMaker에 직접 액세스하여 기본 하드웨어부터 상위 계층 개발 도구까지 통합된 환경을 구성할 수 있습니다.

AWS가 "AI 공장"에 투자하는 유일한 클라우드 컴퓨팅 거대 기업이 아니라는 점은 주목할 가치가 있습니다. 마이크로소프트는 10월 초 글로벌 데이터센터에서 OpenAI와 기타 워크로드를 호스팅하는 데 사용되는 엔비디아 AI 팩토리(NVIDIA AI Factory) 기술을 기반으로 한 AI 인프라를 시연했으며, 이 아키텍처를 중심으로 위스콘신과 조지아에 차세대 'AI 슈퍼 팩토리' 수준의 데이터 센터를 구축했습니다. 그러나 당시 마이크로소프트는 유사한 시스템을 로컬 프라이빗 클라우드 형태로 클라이언트 룸에 직접 배치하는 것을 강조하지 않고, 대신 자체 클라우드 인프라를 구축할 수 있는 능력에 중점을 두었습니다.

데이터 주권을 다루는 측면에서 마이크로소프트는 앞서 다양한 국가에 데이터센터와 클라우드 서비스를 로컬로 구축하겠다는 계획을 발표한 바 있으며, '애저 로컬'을 비롯한 다양한 현지화 솔루션을 제안한 바 있다. Microsoft는 하드웨어를 제공 및 호스팅한 다음 규제 및 규정 준수 요구 사항을 충족하기 위해 고객 사이트에 배포합니다. 이에 비해 AWS는 이번에 고객 소유 데이터센터와 AWS의 'AI 공장 이전' 모델을 명확히 제시해 기존 기업 프라이빗 데이터센터와 퍼블릭 클라우드의 경계를 더욱 모호하게 했고, 하이브리드 클라우드와 기업 호스팅룸은 다시 한번 업계 무대의 중심으로 돌아왔다.

외부 세계의 관점에서 보면 생성 AI의 물결로 인해 여러 주요 클라우드 서비스 제공업체가 엔터프라이즈 기반 데이터 센터 및 하이브리드 클라우드 아키텍처에 대한 투자를 다시 늘리고 있습니다. 이는 10여 년 전 "기업 컴퓨터실이 왕이었던" 시대를 연상시킵니다. NVIDIA와 같은 하드웨어 공급업체가 클라우드 거대 기업과 더욱 긴밀해짐에 따라 "AI 공장"을 중심으로 한 현지화되고 주권적인 배포는 향후 몇 년 내에 AI 인프라를 계획할 때 대규모 조직의 주요 옵션 중 하나가 될 가능성이 높습니다.