Google은 새로 출시된 Gemini AI의 성능 시연이 최소한 한 번은 편집되었음을 인정합니다

구글은 최근 가장 강력한 인공지능 모델 제품군인 Gemini를 출시했지만, 그 성능에 대해 거짓말을 했다는 비난을 받아왔습니다. Bloomberg 칼럼에서는 Google이 최근 동영상에서 Gemini의 실적을 허위로 표현했다고 주장했습니다. 칼럼니스트 파미 올슨(Parmy Olson)은 구글이 이번 주 초 출시 행사에서 인상적인 "What the AIquack" 실습 영상을 상영했다고 말했습니다. 비디오에서 Gemini는 매우 유능해 보였습니다. 아마도 너무 강력했을 수도 있습니다.

이 6분짜리 비디오는 Gemini의 다중 모드 기능(예: 이미지 인식과 결합된 음성 대화 프롬프트)을 보여줍니다. Gemini는 이미지(연결된 사진도 포함)를 빠르게 인식하고 몇 초 안에 반응하며 컵 안의 종이 공과 공 게임을 실시간으로 추적할 수 있는 것으로 보입니다. 물론 이 모든 것은 인간이 할 수 있지만, 다음에 무슨 일이 일어날지 인지하고 예측할 수 있는 AI다.

하지만 YouTube에서 동영상 설명을 클릭하면 Google에는 다음과 같은 중요한 면책 조항이 있습니다. "시연을 위해 대기 시간이 단축되었으며 단순화를 위해 Gemini의 출력이 단축되었습니다."

올슨이 불만을 품은 부분이 바로 이것이다. Bloomberg 기사에 따르면 Google은 비디오 시연이 음성 안내와 함께 실시간으로 진행되지 않고 대신 원본 영상의 정지 이미지 프레임을 사용한 다음 Gemini가 응답할 텍스트 프롬프트를 작성했다는 의견을 요청했을 때 인정했습니다. Olson은 다음과 같이 썼습니다. "이것은 Google이 암시하는 것과는 매우 다릅니다. Gemini는 실시간으로 주변 세계를 관찰하고 응답하는 반면 Gemini와 원활한 음성 대화를 할 수 있다는 것입니다. 공정하게 말하면 Google은 종종 데모 비디오를 편집합니다. 특히 많은 회사가 라이브 시연과 함께 제공되는 기술적 결함을 피하고 싶어하기 때문입니다. 약간의 조정은 종종 '예'입니다. 그러나 Google은 비디오 데모에 문제가 있었습니다. 사람들은 Google의 Duplex 데모에 회의적이었습니다(Duplex 기억하시나요? Duplex는 AI였습니다.) 미용실이나 식당에 전화해서 예약할 수 있는 음성 비서) 그리고 AI 모델의 사전 녹화된 영상은 사람들을 더욱 회의적으로 만드는 경향이 있습니다."

이 경우 Olson은 Gemini가 여전히 OpenAI의 GPT보다 뒤처져 있다는 사실을 사람들이 알지 못하도록 Google이 "과시"하고 있다고 믿습니다.

Google은 이에 동의하지 않습니다. 데모의 진위 여부에 대해 질문을 받았을 때 Google은 Google DeepMind의 연구 부사장이자 딥 러닝 책임자인 Oriol Vinyals(Gemini의 공동 책임자이기도 함)의 기사를 가리키며 팀이 동영상을 제작한 방법을 설명했습니다.

Vinyals는 "동영상의 모든 사용자 메시지와 출력은 실제이며 간결성을 위해 단축되었습니다. 동영상은 Gemini로 구축된 다중 모드 사용자 경험을 보여줍니다. 우리는 개발자에게 영감을 주기 위해 이를 만들었습니다."라고 말했습니다.

그는 팀이 Gemini에게 사진과 텍스트를 주고 다음에 무슨 일이 일어날지 예측하도록 요청했다고 덧붙였습니다.

이는 확실히 상황을 처리하는 한 가지 방법이지만, 적어도 대중의 눈에는 올해 OpenAI의 엄청난 성공에 당황한 Google에게는 적합하지 않을 수 있습니다. Google이 개발자에게 인센티브를 제공하려는 경우 AI의 기능을 잘못 표현할 수 있는 신중하게 편집된 홍보 동영상을 통해서는 그렇게 할 수 없습니다. 하지만 언론인과 개발자가 실제로 제품을 경험하게 함으로써 가능합니다. 소규모 공개 베타를 통해 사람들이 Gemini를 사용하여 어리석은 일을 하도록 하세요. 얼마나 강력한지 살펴보겠습니다.