Google DeepMind는 일부 사용자에게 Project Genie라는 새로운 AI 모델을 공개합니다. 사용자는 텍스트 프롬프트나 이미지 업로드를 통해 어떤 스타일의 가상 세계도 즉시 생성할 수 있으며, 비디오 게임을 하는 것처럼 캐릭터나 차량을 제어하여 자유롭게 탐색할 수 있습니다. 이 기능은 현재 웹 앱을 통해 사용할 수 있으며, 미국에 Google Ultra 계정이 있고 18세 이상인 사용자가 사용해 볼 수 있습니다.
Project Genie는 Google이 이전에 2025년 8월 소수의 테스터에게 시연했던 Genie 3 모델을 기반으로 하며 회사 자체의 Nano Banana Pro 이미지 생성 모델과 Gemini 다중 모드 모델을 결합하여 자연어 신호를 몰입형 대화형 장면으로 변환합니다. 사용자가 만들 수 있는 세계의 유형은 외계 행성 위로 우주선을 날리는 것, 1950년대 스타일의 유럽 도시 위로 비행선을 날리는 것, 아마존 열대 우림 속 깊은 곳에서 테이퍼를 뛰게 하는 것 등 매우 다양하며, 이 모든 것들은 간단한 설명이나 참고 사진만으로 빠르게 생성될 수 있습니다.
구체적인 경험 측면에서 프로젝트 지니는 플레이어가 캐릭터를 움직이고 시점을 회전시키는 방식을 기반으로 가상 세계에서 실시간으로 프레임을 생성하고, 장면 내 객체와의 상호 작용 및 환경 변화에 대한 대응을 지원합니다. 예를 들어, 공식 시연 영상에서 파란색 공이 흰 잔디 위를 굴러갈 때 공이 지나가는 모든 것은 파란색으로 "채색"되어 지속적으로 변화하는 궤적 효과를 형성합니다. 동시에, 애플리케이션에는 사용자가 빠른 시작을 위해 생성하고 수정할 수 있는 내장 월드 템플릿 라이브러리도 있습니다.

사용자는 이러한 환경을 탐색할 수 있을 뿐만 아니라 자신이 그린 캐릭터, 실제 물체의 사진 등을 자료로 업로드하고 다양한 요소 간의 상호 작용 논리를 설정하여 보다 개인화된 가상 경험을 구축할 수 있습니다. 일부 장면에서는 GPS 내비게이션 인터페이스와 유사한 동적 피드백을 볼 수도 있습니다. 플레이어가 방향을 바꾸거나 움직일 때 인터페이스의 지도도 업데이트되어 몰입감과 플레이 가능성이 향상됩니다.
Project Genie 팀원인 Jack Parker-Holder 및 Diego Rivas와의 인터뷰에서 유튜버 Bilawal Sidhu는 현재 시스템이 실제 시연에서 여전히 가끔 버그가 발생하고 각 경험이 60초로 제한되어 있다는 점을 지적했는데, 이는 현재 가장 큰 기능적 제약 중 하나입니다. 그러나 개발팀은 앞으로 사용자 입력에서 환경과 캐릭터 행동에 대한 더 많은 제어권을 부여하는 방법을 탐구하는 데 중점을 두고 가상 세계의 지속 시간을 연장하고 60초 상한선을 깨기 위한 가능한 솔루션을 연구할 것이라고 밝혔습니다.
애플리케이션 시나리오의 경우 DeepMind 팀은 아직 명확한 단일 방향을 제시하지 않았지만 여러 분야에서의 잠재력에 대해 낙관하고 있습니다. 보고서에 따르면 Project Genie는 비디오 게임 아이디어의 프로토타입을 빠르게 제작하고, 영화 제작자가 장면과 스토리보드를 시각화하는 데 도움을 주며, 사용자에게 전문적인 개발 기술이 없어도 재해 후 구조 작업 참여 시뮬레이션과 같이 학생들이 교실에서 보다 대화형 방식으로 복잡한 개념이나 전문적인 시나리오를 이해하는 데 도움이 될 것으로 예상됩니다.

저자는 또한 이 기술의 개방에는 유해하거나 부적절한 콘텐츠의 생성을 방지하기 위한 "가드레일"을 설정하는 방법, 생성 과정에서 잠재적인 저작권 침해 문제를 방지하는 방법을 포함하여 콘텐츠 보안 및 규정 준수 문제가 필연적으로 수반될 것이라고 우려하고 있습니다. Google은 아직 거버넌스 메커니즘을 자세히 공개하지 않았지만 향후 제품 반복에서 관련 전략을 계속 조정할 것으로 예상됩니다.
현재 미국에 거주하며 Google AI Ultra를 구독하는 사용자는 이미 Google 실험 프로젝트 페이지를 통해 Project Genie를 직접 경험할 수 있습니다. 더 많은 지역과 사용자에게 더욱 개방됨에 따라 "한 문장으로 가상 세계를 생성하고 입력하는" 이 새로운 AI 상호 작용 방법은 게임 개발, 창의적인 디자인, 교육 및 훈련 분야에서 중요한 도구 중 하나가 될 수 있습니다.