Alphabet(Google의 모회사)은 실시간 오디오 및 비디오 애플리케이션을 위해 특별히 제작된 새로운 인공 지능 모델인 Gemini 3.1 Flash Live를 출시했습니다. 이러한 움직임은 멀티모달 AI 분야의 경쟁이 심화됨을 의미합니다. Google은 이것이 지금까지 구축한 최고의 오디오 및 음성 시스템이라고 말합니다. 이 모델은 소비자 및 기업 제품에 대해 보다 자연스러운 대화 경험과 보다 빠른 응답을 제공하도록 설계되었습니다. 이 릴리스는 보다 원활한 음성 우선 대화형 경험을 원하는 개발자, 기업 및 일반 사용자를 대상으로 합니다.

Google은 Gemini 3.1 Flash Live가 이전 모델보다 빠르며 대화 컨텍스트 메모리를 두 배로 늘릴 수 있다고 말합니다. 이는 브레인스토밍, 실시간 검색, 복잡한 질문 및 답변 교환과 같은 긴 대화 시나리오에서 모델을 더욱 실용적으로 만듭니다.

이 모델은 이제 Gemini Live, 실시간 검색 기능, Google AI Studio의 Gemini Live API, Gemini Enterprise를 포함한 여러 Google 제품에 통합되었습니다. 이러한 광범위한 통합은 Google이 최신 AI 기술을 단지 독립형 제품으로 출시하는 것이 아니라 전체 생태계에 통합하고 있음을 보여줍니다.

실시간 음성 및 다중 모드 기능이 AI의 핵심 격전지가 되고 있으며, 주요 플랫폼이 이를 비즈니스에서 더 쉽게 사용하고 더 널리 사용할 수 있도록 경쟁하고 있기 때문에 이러한 변화는 중요합니다.