올해 I/O 개발자 컨퍼런스에서 Google은 차세대 Gemini 3.5 시리즈 모델과 새로운 Gemini Omni 시리즈를 공식 출시했습니다. Gemini 3.5 Flash는 처음으로 대중에게 공개된 반면 Gemini Omni는 "모든 입력에서 비디오를 생성"하는 기능에 중점을 둡니다.

Gemini 3.5 Flash는 이미 Gemini 앱과 Google 검색의 AI 모드를 통해 모든 사용자가 사용할 수 있습니다. Google은 이 모델이 Flash 시리즈의 일관된 고속 성능을 유지하면서 여러 측면에서 대형 플래그십 모델과 비교할 수 있는 지능 수준을 갖추고 있다고 주장합니다.

소개에 따르면 Gemini 3.5 Flash는 현재 가장 강력한 Gemini 에이전트 및 코드 생성 모델입니다. 복잡한 코드 및 에이전트 관련 벤치마크 테스트에서도 Gemini 3.1 Pro를 능가하며, 멀티모달 이해에서도 선두를 유지하고 있어 현재 기본 모델로도 설정되어 있습니다. 사용자는 일일 검색, 인앱 대화 및 기타 시나리오에서 이 모델을 직접 호출하여 더 빠르고 스마트한 답변과 코드 지원을 얻을 수 있습니다.

동시에 공개된 Gemini Omni는 생성적 비디오 방향에 대한 Google의 최신 시도를 나타냅니다. 이 새로운 모델은 모든 입력에서 비디오를 생성할 수 있습니다. 사용자는 이미지, 오디오, 비디오 및 텍스트를 입력으로 자유롭게 결합할 수 있으며 모델은 Gemini의 실제 지식을 기반으로 고품질 비디오 콘텐츠를 생성합니다. 생성이 완료된 후 사용자는 자연어를 통해 여러 차례의 대화형 편집을 수행하여 비디오의 세부 사항을 수정하고 미세 조정할 수도 있습니다.

Gemini Omni 시리즈의 첫 번째 모델은 Gemini Omni Flash로, 비디오의 부분적 또는 전체적 수정을 지원하고 여러 제작 과정에서 원본 장면의 내러티브 일관성을 계속 유지할 수 있어 사용자가 메인 스토리 라인을 잃지 않고 지속적으로 조정할 수 있습니다. 구글은 이 모델이 중력, 운동에너지, 유체 역학 등의 물리적 개념을 보다 직관적으로 이해해 보다 현실적이고 신뢰할 수 있는 역동적인 장면을 생성할 수 있다고 밝혔습니다.

창의적인 경험 측면에서 Gemini Omni는 사용자가 자신의 음성과 아바타를 사용하여 비디오 제작에 참여할 수 있도록 하여 개인 특성을 지닌 디지털 아바타를 생성합니다. 합성 콘텐츠의 추적성 및 보안 문제를 처리하기 위해 이 모델로 생성된 모든 비디오에는 AI 생성 콘텐츠에 라벨을 지정하고 식별하기 위한 SynthID 디지털 워터마크가 포함됩니다.

가용성 측면에서 Gemini Omni Flash는 오늘부터 전 세계 구독자에게 제공됩니다. Google AI Plus, Pro 및 Ultra 요금제를 구독하는 사용자는 Gemini 앱 및 Google Flow에서 직접 모델을 사용할 수 있습니다. 동시에 Google은 이 기능을 YouTube Shorts 및 YouTube Create에 무료로 도입하여 더 많은 제작자가 주류 콘텐츠 플랫폼에서 Gemini 기술을 기반으로 한 동영상 생성 기능을 경험할 수 있도록 했습니다.