Google은 최근 Gemini 챗봇의 대규모 업그레이드를 시작했습니다. 사용자가 질문하면 시스템이 텍스트로 답변할 수 있을 뿐만 아니라 대화형 3D 모델과 물리적 시뮬레이션 장면을 직접 생성할 수도 있습니다. 이는 사용자가 "문제를 확인"하고 싶을 때 이제 Gemini가 매개변수 제어 기능을 갖춘 회전 가능하고 확장 가능한 3D 시각화를 통해 이를 수행할 수 있음을 의미합니다.

Google에 따르면 새로운 기능을 활성화한 후 Gemini는 3D 모델이나 시뮬레이션을 생성할 때 동시에 여러 상호 작용 방법을 제공할 것입니다. 사용자는 드래그하여 모델을 회전하고 세부 사항을 확대할 수 있을 뿐만 아니라 슬라이더를 통해 변수를 수동으로 조정하거나 다른 값을 입력하여 변화를 실시간으로 관찰할 수도 있습니다. 물리적 프로세스나 추상적인 개념과 관련된 질문의 경우 이러한 유형의 대화형 시각화가 새로운 유형의 답변 형식이 될 것으로 예상됩니다.
실제 경험에서 기자는 '지구 주위를 도는 달의 시뮬레이션 생성'을 테스트의 예로 들었다. 그런 다음 Gemini는 시각적인 3차원 장면을 생성합니다. 사용자는 슬라이더를 사용하여 달의 회전 속도를 조정하고, 스위치를 사용하여 궤도를 나타내는 궤적 선을 숨기거나 표시하고, 버튼을 사용하여 데모를 일시 중지하거나 계속할 수 있습니다. 동시에 사용자는 전체 3D 모델 세트를 확대/축소하고 회전하여 다양한 관점에서 이동 과정을 관찰할 수도 있습니다.
이전에 Gemini는 사용자 프롬프트를 기반으로 대화형 평면 이미지 생성을 지원했지만 여전히 이미지 수준 상호 작용으로 제한되었습니다. 이번 업그레이드는 기능을 3D 모델 및 동적 시뮬레이션으로 확장하여 복잡한 개념에 대한 AI 지원 이해 및 표현 수단을 더욱 풍부하게 합니다. 이 업데이트는 또한 "시각적 답변"을 놓고 대규모 모델 공급업체 간의 경쟁 중에도 제공됩니다. 얼마 전 Anthropic은 Claude를 위한 차트, 회로도 및 기타 대화형 시각화를 자동으로 생성하는 기능을 도입했으며 OpenAI는 ChatGPT에 수학적 및 과학적 개념에 대한 시각화 도구도 추가했습니다.
현재 모든 Gemini 앱 사용자는 "Pro" 모델을 선택하여 이 새로운 기능을 경험할 수 있습니다. 작업 경로는 응용 프로그램에서 모델을 Pro로 전환한 다음 Gemini에 "이중 진자 시스템 표시" 및 "도플러 효과 시각화를 도와주세요"와 같은 요청을 하는 것입니다. Gemini가 텍스트 설명을 반환하면 "시각화 표시" 버튼이 인터페이스 하단에 나타납니다. 해당 3D 모델 또는 시뮬레이션 장면을 생성하려면 클릭하세요.