Microsoft는 최근 자체 개발한 AI 칩 'Maia 200'의 첫 번째 배치가 데이터 센터에서 공식적으로 사용되었다고 발표했으며 앞으로 몇 달 안에 글로벌 배포를 더욱 확대할 계획입니다. 이 칩은 마이크로소프트가 추론 시나리오를 위한 'AI 추론 파워 엔진'으로 포지셔닝한 것으로, 주로 대형 모델 온라인 추론 등 고강도 생산 수준 워크로드에 최적화됐다. Microsoft가 발표한 성능 지표에 따르면 Maia 200은 처리 속도 측면에서 Amazon의 최신 Trainium 칩과 Google의 최신 세대 TPU를 능가할 수 있습니다. 클라우드 제조사가 자체 개발한 AI 가속 칩 경쟁에서 기술 우위를 선점하겠다는 의도다.

클라우드 컴퓨팅 거대 기업이 자체 개발한 AI 칩의 중요한 배경은 현재 Nvidia와 같은 제조업체의 최신 고급 GPU에 대한 높은 비용과 타이트한 공급입니다. 이러한 공급 병목 현상은 여전히 ​​단기적으로 완화되기 어려울 것입니다. 하지만 자체 개발한 고성능 AI 칩을 보유하더라도 마이크로소프트는 엔비디아, AMD로부터 칩 구매를 멈추지 않을 것이다. Microsoft CEO Satya Nadella는 회사가 Nvidia 및 AMD와 "훌륭한 파트너십"을 유지하고 있으며 두 당사자 모두 각자의 분야에서 혁신을 계속 촉진하고 있다고 말했습니다. 그의 견해에 따르면 시장 여론은 종종 "누가 앞서고 있는지"를 비교하는 데 열중하지만 실제 핵심은 장기간에 걸쳐 선두를 유지하는 것입니다.

나델라는 또한 마이크로소프트가 수직적 통합 능력을 갖고 있다고 강조했지만 이것이 회사가 위에서 아래로 자체 기술만 사용하고 생태학적 파트너의 솔루션을 완전히 포기한다는 의미는 아닙니다. 즉, 자체 개발한 칩 외에도 Microsoft는 빠르게 성장하는 AI 클라우드 컴퓨팅 요구를 지원하기 위해 Nvidia 및 AMD와 같은 공급업체의 다양한 하드웨어 포트폴리오에 계속 의존할 것입니다.

Microsoft의 합의에 따라 Maia 200은 회사 내부의 "Superintelligence" 팀에 우선권을 부여받게 됩니다. 전 Google DeepMind 공동 창업자인 Mustafa Suleiman이 이끄는 팀은 Microsoft를 위한 차세대 최첨단 대형 모델을 구축하는 일을 담당하고 있습니다. 마이크로소프트가 자체 첨단 모델 구축에 투자하는 것은 향후 오픈AI(OpenAI), 앤트로픽(Anthropic) 등 제3자 모델 공급업체에 대한 의존도를 어느 정도 줄이기 위한 것으로 일반적으로 여겨진다. Suleiman이 소셜 플랫폼에 게시했습니다.

동시에 Maia 200은 Microsoft Azure 클라우드 플랫폼에서 실행되는 OpenAI 모델도 지원하여 클라우드 고객에게 더 많은 AI 컴퓨팅 성능 옵션을 제공합니다. 그러나 모든 당사자의 피드백에 따르면 가장 발전된 AI 하드웨어 리소스를 확보하는 것은 여전히 ​​전체 업계가 직면한 일반적인 문제입니다. 이러한 긴장된 상황은 유료 고객뿐만 아니라 클라우드 공급업체의 내부 AI R&D 팀에도 영향을 미칩니다. 이러한 공급 환경에서 마이크로소프트는 자체 개발한 AI 가속 칩 구현을 가속화하는 한편, 규모 확장과 성능 최적화 측면에서 AI 인프라의 이중 요구 사항을 보장하기 위해 NVIDIA 및 AMD로부터 구매를 계속 늘리고 있습니다.