Google은 Meta_5iter.com에 대한 Gemini 컴퓨팅 전원 공급을 줄입니다.

파이낸셜타임스(Financial Times)에 따르면, 구글은 올해 3월쯤 메타에게 제미니(Gemini) 모델에 대한 대규모 컴퓨팅 능력과 용량 요구를 더 이상 충족할 수 없다고 경고했고, 이로 인해 메타는 사용을 줄이고 여러 내부 AI 프로젝트를 연기하게 됐다. 관련 제한 사항은 여전히 진행 중입니다. Meta는 내부 직원들에게 AI 토큰 소비를 "자세히 관찰"하고 모델 입력, 출력 및 전체 사용량을 호출하는 데 보다 제한적인 접근 방식을 사용하도록 요청했습니다. 이는 내부적으로 적극적으로 홍보하고 심지어 지난 1년 동안 특정 시나리오에서 AI 사용을 "의무화"한 회사의 태도와 뚜렷한 대조를 이룹니다.

보고서는 Meta가 최근 몇 년 동안 자체 Llama 오픈 소스 모델을 구축하는 데 막대한 투자를 하고 CEO Mark Zuckerberg가 AI가 회사의 차세대 핵심 플랫폼이 될 것이라고 지속적으로 선언했지만 Meta는 실제로 많은 주요 비즈니스 링크에서 Google의 Gemini에 크게 의존하고 있다고 지적했습니다. 이 문제에 정통한 사람들에 따르면 Meta는 고객 서비스, 광고주 챗봇, 코드 생성, 의심스럽거나 유해한 콘텐츠 제거 및 사기 탐지와 같은 시나리오에서 Gemini를 광범위하게 사용하고 있으며 Meta의 자체 모델보다 성능이 우수하기 때문에 내부 선호 솔루션으로 선택되었습니다. 동시에 Anthropic의 Claude도 경쟁하여 일부 비즈니스에서 이를 사용하고 있습니다.

Google의 공급 긴축은 Meta뿐만 아니라 Google Cloud 및 Gemini를 사용하는 다른 고객에게도 영향을 미치지만 Meta는 유사한 고객보다 수요가 훨씬 높다는 점에서 눈에 띕니다. 메타는 구글, 마이크로소프트, 아마존과 달리 자체 클라우드 컴퓨팅 사업을 운영하지 않는다. 즉, 내부 자체 개발한 AI 시스템 외에 외부 컴퓨팅 파워와 모델 서비스를 경쟁사로부터 구매해야 한다는 뜻이다. 내부 수요가 급속히 확대되는 상황에서 이러한 구조적 의존성 문제는 더욱 증폭된다.

급증하는 AI 수요에 대응하기 위해 구글은 최근 몇 년간 데이터센터와 전용 하드웨어에 대한 투자를 지속적으로 늘려왔다. 클라우드 사업 분기별 매출은 200억 달러를 넘어섰고, 미완료 주문 잔고는 4,600억 달러에 육박해 전체 컴퓨팅 파워 시장 수요가 기존 생산 능력을 훨씬 초과하고 있음을 보여준다. 구글은 자사 모델이 직접 API 호출을 통해 분당 160억 개 이상의 토큰을 처리했다고 밝혔는데, 이는 전 분기보다 약 60% 증가한 수치입니다. 이는 대형 모델의 상용화 단계에서는 컴퓨팅 파워와 용량이 핵심 병목 자원이 되고 있다는 측면에서도 확인됐다.

Meta는 다른 경로에서 동일한 문제를 해결하려고 노력하고 있습니다. 한편으로는 회사가 자체 데이터 센터를 확장하고 다른 한편으로는 Broadcom과 협력하여 맞춤형 MTIA 가속 칩을 개발하고 있으며 향후 Google과 같은 클라우드 서비스 및 모델 제공업체에 대한 의존도를 점차적으로 낮추기를 희망하고 있습니다. 메타버스에 대한 배팅이 좌절된 이후, 메타는 AI 분야에서 '차세대 플랫폼' 내러티브 구축이 시급하다. 외부 모델에 대한 과도한 의존으로 인해 "제한적"으로 발생한 이번 사건은 인프라 및 컴퓨팅 성능 레이아웃의 단점과 시급성을 드러냈습니다.