Google은 Bard 인공 지능이 자신을 의심하고 모순되는 정보를 확인하는 방법을 학습하도록 허용합니다.

오늘은 ChatGPT에 대한 Google의 답변인 Bard의 발전과 Bard가 오늘날 챗봇의 가장 시급한 문제 중 하나인 챗봇의 꾸며내는 경향을 어떻게 해결하는지에 대해 이야기해 보겠습니다.

작년에 챗봇이 출시되었을 때부터 제조사에서는 챗봇을 믿지 말라고 경고해왔습니다. ChatGPT와 같은 도구로 생성된 텍스트는 확립된 사실의 데이터베이스를 기반으로 하지 않습니다. 대신, 챗봇은 기본 대규모 언어 모델을 기반으로 훈련된 대규모 텍스트 모음을 기반으로 어떤 단어가 올바른 것으로 보이는지에 대한 확률론적 추측을 하는 예측 기능을 제공합니다.

결과적으로 챗봇은 업계 용어로 "자신있게 실수를 저지르는" 경우가 많습니다. 올해 ChatGPT에서 생성된 인용문을 제출한 변호사의 사례를 본 것처럼 이는 교육 수준이 높은 사람들도 속일 수 있습니다. 모든 사건이 허공에서 만들어졌다는 사실을 깨닫지 못한 것입니다.

이러한 상황은 내가 챗봇이 연구 보조자로서 대부분 쓸모없다고 생각하는 이유를 설명합니다. 그들은 몇 초 안에 당신이 원하는 것을 말해주지만 대부분의 경우 그들의 연구 결과를 인용하지는 않습니다. 따라서 답변이 사실인지 조사하는 데 많은 시간을 소비해야 하며, 이는 애초에 챗봇을 사용하는 목적을 달성하지 못하는 경우가 많습니다.

Google의 Bard가 올해 초 출시되었을 때 사용자의 검색어를 회사의 검색 엔진에 제출하는 'GoogleIt' 버튼이 있었습니다. 이를 통해 챗봇의 출력에 대해 더 빨리 2차 의견을 얻을 수 있지만, 그것이 사실인지 거짓인지 판단해야 하는 책임은 여전히 사용자에게 있습니다.

하지만 오늘부터 Bard가 당신을 위해 더 많은 일을 해줄 것입니다. 챗봇이 질문 중 하나에 답변한 후 Google 버튼을 클릭하여 답변을 '검토'하세요. 회사가 블로그 게시물에서 설명하는 방법은 다음과 같습니다.

"G" 아이콘을 클릭하면 "Bard"가 귀하의 답변을 읽고 귀하의 답변을 확증하는 콘텐츠가 웹에 있는지 평가합니다. 주장을 평가할 수 있는 경우 강조 표시된 문구를 클릭하여 검색을 통해 찾은 뒷받침하거나 모순되는 정보에 대해 자세히 알아볼 수 있습니다.

쿼리를 면밀히 조사하면 응답의 많은 문장이 녹색 또는 갈색으로 변합니다. 참조 웹 페이지에 대한 녹색 링크로 강조 표시된 답변입니다. 이 페이지 중 하나 위에 마우스를 올리면 Bard가 정보의 출처를 보여줍니다. 갈색으로 강조 표시된 응답은 Bard가 메시지의 출처를 모르고 강조 표시가 오류일 수 있음을 나타냅니다.

예를 들어, 밴드 라디오헤드의 역사에 대한 내 질문에 대한 바드의 답변을 다시 확인해보니 내가 알고 있는 것과 일치하는 녹색으로 강조 표시된 문장이 많이 나와 있었다. 그러나 이는 또한 문장을 갈색으로 바꿉니다. "그들은 6개의 그래미 상과 9개의 브릿 상을 포함하여 수많은 상을 받았습니다." 이 문장 위로 마우스를 가져가면 Google 검색 결과에 상충되는 정보가 표시됩니다. 사실, 라디오헤드는 브릿 어워드 9개는커녕 단 한 번도 수상한 적이 없습니다.

구글의 제품 담당 수석 이사인 잭 크로치크(Jack Krawczyk)는 지난주 인터뷰에서 “내 인생에서 일어난 비극에 대해 이야기하겠다”고 말했다.

Krawczyk은 집에서 황새치를 요리하고 있었는데, 요리 과정에서 나는 냄새가 집 전체에 스며드는 것 같았습니다. 그는 Bard를 사용하여 탈취 방법을 찾은 다음 결과를 면밀히 조사하여 사실과 허구를 분리했습니다. 챗봇이 처음 말했듯이 주방을 철저히 청소하는 것만으로는 문제가 해결되지 않는 것으로 나타났습니다. 하지만 집 주변에 베이킹 소다 그릇을 놔두면 도움이 될 수 있습니다.

Krawczyk은 사람들이 Bard를 매우 다양한 방식으로 사용하기 때문에 다시 확인할 필요가 없는 경우가 많다고 말했습니다. (일반적으로 자신이 쓴 시나 초안을 작성한 이메일 등을 다시 확인하도록 요청하지 않습니다.)

이중 확인은 분명한 개선을 의미하지만 여전히 모든 인용을 꺼내고 Bard가 해당 검색 결과를 올바르게 해석하고 있는지 확인해야 하는 경우가 많습니다. 적어도 연구에 있어서는 AI가 우리 손을 잡고 있는 것처럼 인간도 여전히 AI의 손을 잡고 있습니다.

그러나 이는 환영할 만한 발전이다.

"우리는 실수를 인정하는 최초의 언어 모델을 만들었을 것입니다"라고 Krawczyk은 말했습니다. "이러한 모델 개선의 중요성을 고려할 때 AI 모델이 실수를 정확하게 인정하도록 보장하는 것이 업계의 최우선 과제가 되어야 합니다."

화요일에 Bard는 또 다른 대규모 업데이트를 받았습니다. 이제 Gmail, 문서, 드라이브 및 YouTube 및 지도를 포함한 기타 Google 제품에 연결할 수 있습니다. 소위 확장 프로그램을 사용하면 Google 계정에 저장된 문서를 실시간으로 검색, 요약하고 질문할 수 있습니다.

현재는 개인 계정으로 제한되어 있어 유용성이 크게 제한되지만, 웹을 탐색하는 대체 방법으로는 때로는 재미있습니다. 예를 들어, 인테리어 디자인을 시작하는 방법에 대한 멋진 동영상을 보여달라고 요청했을 때 아주 잘 해냈습니다. (바드 답변창에서 이 영상들을 온라인으로 재생할 수 있다는 점이 참 좋네요.)