최근 BBC 조사에 따르면 인공지능 챗봇은 뉴스 보도의 정확성 측면에서 여전히 심각한 결함을 갖고 있으며, 생성된 콘텐츠의 거의 절반에 오류가 포함되어 있는 것으로 나타났습니다. BBC와 유럽의 22개 공공 미디어 기관이 공동으로 발표한 분석 보고서에 따르면, 18개 국가, 14개 언어 환경에서 AI 챗봇이 뉴스 기관 콘텐츠에 접근하고 관련 질문에 답변했을 때 응답의 약 45%에 오류가 포함되어 있었습니다.

이러한 오류에는 부정확한 문장과 잘못된 인용뿐만 아니라 오래된 정보, 잘못된 인용, 소스 불일치 등의 문제도 포함됩니다. 보고서는 챗봇이 인용된 실제 출처와 일치하지 않는 링크를 제공하는 경우가 많으며 자료를 정확하게 인용하더라도 사실과 의견, 풍자와 합법적인 저널리즘을 구별하지 못한다고 지적합니다.

OpenAI, Google, Microsoft 등 주요 기술 기업은 생성 AI 챗봇을 적극적으로 홍보하고 이를 인터넷 플랫폼에 심층적으로 통합하여 사용자가 자동으로 정보를 획득하고 분석할 수 있도록 지원하고 있습니다. 개발자들은 '환각'(즉, AI 콘텐츠 조작) 현상을 줄이기 위해 계속해서 많은 자원을 투자하고 있지만, 이 문제는 아직 단기간에 완전히 해결하기 어려운 것으로 보고되고 있다.

실제 테스트에서 ChatGPT, Copilot, Gemini 등 많은 주류 AI 도구에는 모두 심각한 오류가 있었습니다. 예를 들어, 그들은 프란치스코 교황이 여전히 재임 중이라고 잘못 기술하고 있지만 실제로는 레오 14세가 교황의 뒤를 이었습니다. 일부 AI는 프란치스코의 사망 날짜까지 정확하게 보고했지만 여전히 그를 현 교황으로 묘사했습니다. 또한 관련 리더십 직책에 대한 오래되고 잘못된 정보가 있습니다.

보고서는 또한 이러한 문제가 한 지역이나 언어에 국한되지 않고 전 세계적으로 널리 퍼져 있음을 보여줍니다. 그중 Google의 Gemini는 응답의 72%에 심각한 소스 오류가 포함되어 정확도가 가장 낮습니다. OpenAI는 이전에 초기 버전이 2021년 9월까지만 훈련되어 실시간 인터넷 정보를 얻지 못했다는 사실에 이러한 오류가 있다고 생각했습니다. 그러나 더 이상 적용할 수 없습니다. 따라서 문제는 알고리즘 자체에서 발생할 가능성이 가장 높으며 데이터 업데이트를 통해 해결하기 어렵습니다.

올해 2월 BBC의 별도 테스트에 비해 심각한 오류 비율이 51%에서 37%로 줄었지만 여전히 제미니는 다른 제품에 뒤처진다. 좋지 않은 결과에도 불구하고 연구원들은 영국 대중이 AI 뉴스 요약에 대해 높은 수준의 신뢰를 보였다는 사실을 발견했습니다. 영국 성인의 1/3 이상과 35세 미만의 거의 절반이 AI가 뉴스 내용을 정확하게 요약할 수 있다고 믿었습니다. 42%의 대중은 AI가 원본 뉴스 콘텐츠를 왜곡할 경우 뉴스 조직 자체의 신뢰성에 의문을 제기하거나 신뢰도를 떨어뜨릴 것이라고 답했습니다. 전문가들은 생성 AI 도구의 인기가 높아지면서 이러한 문제가 지속될 경우 주류 언론사의 명성과 신뢰성이 심각하게 훼손될 수 있다고 경고합니다.