DeepMind의 최신 인공 지능은 기하학 문제를 해결할 수 있습니다

Google의 인공 지능 연구 개발 연구소인 DeepMind는 인공 지능 시스템의 기능을 향상시키는 열쇠는 어려운 기하학적 문제를 해결하는 새로운 방법을 발견하는 데 있다고 믿습니다. 이를 위해 DeepMind는 오늘 AlphaGeometry를 출시했습니다. 이 시스템은 평균적인 국제 수학 올림피아드 금메달리스트와 동등한 수준으로 기하학 문제를 해결할 수 있다고 연구소에서 주장하고 있습니다.

오늘 아침 코드가 오픈소스로 공개된 AlphaGeometry는 표준 시간 제한 내에 이전 최첨단 시스템의 10개를 초과하는 25개의 올림피아드 기하학 문제를 해결할 수 있습니다.

"올림피아드 수준의 기하학 문제를 해결하는 것은 심층적인 수학적 추론을 개발하는 데 중요한 이정표이자 더욱 발전된 범용 AI 시스템을 향한 필수 단계입니다."라고 Google AI 연구 과학자 Trieu Trinh과 Thang Luong이 오늘 아침에 게시한 블로그 게시물에서 썼습니다. "[우리는] AlphaGeometry가 수학, 과학, 인공 지능 분야의 새로운 가능성을 여는 데 도움이 되기를 바랍니다."

왜 기하학에 집중하는가? DeepMind는 수학적 정리를 증명하거나 정리(예: 피타고라스 정리)가 참인 이유를 논리적으로 설명하려면 일련의 가능한 단계에서 솔루션을 선택하는 추론과 능력이 모두 필요하다고 주장합니다. DeepMind가 옳다면, 이 문제 해결 접근 방식은 언젠가 일반 인공 지능 시스템에 유용하다는 것이 입증될 수 있습니다.

DeepMind는 보도 자료에서 다음과 같이 썼습니다. "특정 추측의 진실 또는 허위를 증명하는 것은 오늘날 가장 발전된 인공 지능 시스템의 능력을 넘어서는 것입니다. 이 목표를 향해 수학적 정리를 증명할 수 있다는 것은... 논리적 추론의 숙달과 새로운 지식 발견 능력을 보여주기 때문에 중요한 이정표입니다."

그러나 기하학적 문제를 해결하기 위해 인공지능 시스템을 훈련시키는 것은 독특한 과제를 안고 있습니다.

증명을 기계가 이해할 수 있는 형식으로 변환하는 과정의 복잡성으로 인해 사용 가능한 기하학적 훈련 데이터가 부족합니다. 오늘날의 최첨단 생성 AI 모델 중 다수는 데이터의 패턴과 관계를 식별하는 데 탁월하지만 정리를 통해 논리적으로 추론하는 능력이 부족합니다.

AlphaGeometry를 설계할 때 연구소에서는 ChatGPT와 아키텍처가 유사한 모델인 "신경 언어" 모델과 "기호 파생 엔진"(수학적 규칙과 같은 규칙을 활용하여 문제에 대한 해결책을 추론하는 엔진)을 결합했습니다. 기호 엔진은 특히 크거나 복잡한 데이터 세트로 작업할 때 유연성이 없고 느릴 수 있습니다. 그러나 DeepMind는 신경 모델이 추론 엔진을 "안내"하여 주어진 기하학적 문제에 대한 가능한 답을 찾도록 함으로써 이러한 문제를 완화합니다.

훈련 데이터를 대체하기 위해 DeepMind는 자체 합성 데이터를 생성하여 1억 개의 "합성 정리"와 다양한 복잡성의 증명을 생성했습니다. 그런 다음 연구소에서는 합성 데이터를 바탕으로 AlphaGeometry를 처음부터 훈련하고 올림픽 기하학 문제에 대해 평가했습니다.

올림픽 기하학 문제는 다이어그램을 기반으로 하며 문제를 해결하기 전에 점, 선, 원과 같은 "구조"를 추가해야 합니다. 이러한 문제에 적용할 때 AlphaGeometry의 신경 모델은 어떤 구성을 추가해야 할지 예측합니다. AlphaGeometry의 기호 엔진은 이러한 예측을 사용하여 유사한 솔루션을 찾기 위해 다이어그램을 추론합니다.

Trinh과 Luong은 다음과 같이 썼습니다. "이러한 구성이 어떻게 증명으로 이어지는지에 대한 많은 예를 통해 AlphaGeometry의 언어 모델은 올림픽 기하학 문제에 직면할 때 새로운 구성에 대한 좋은 제안을 할 수 있습니다. 한 시스템은 빠르고 '직관적인' 아이디어를 제공하는 반면, 다른 시스템은 보다 사려 깊고 합리적인 결정을 제공합니다."

이번 주 Nature 저널에 게재된 AlphaGeometry의 솔루션은 인공 지능 시스템이 기호 조작(즉, 규칙을 사용하여 지식을 나타내는 기호를 조작하는 것)을 기반으로 해야 하는지, 아니면 표면적으로는 뇌처럼 보이는 신경 네트워크에 기반을 두어야 하는지에 대한 장기적인 논쟁을 촉발할 가능성이 높습니다.

신경망 접근 방식을 지지하는 사람들은 음성 인식부터 이미지 생성까지 지능적인 행동이 엄청난 양의 데이터와 계산을 통해 나타날 수 있다고 믿습니다. 신경망은 특정 작업(예: 워드 프로세싱 소프트웨어의 줄 편집)에 특화된 일련의 기호 조작 규칙을 정의하여 작업을 해결하는 기호 시스템과 비교하여 통계적 근사와 예제 학습을 통해 작업을 해결하려고 시도합니다.

신경망은 OpenAI의 DALL-E3 및 GPT-4와 같은 강력한 인공 지능 시스템의 초석입니다. 그러나 상징적 AI 지지자들은 신경망이 전능하지 않다고 주장합니다. 이들 지지자들은 상징적 AI가 세계에 대한 지식을 효율적으로 인코딩하고, 복잡한 시나리오에서 추론하고, 답변에 도달하는 방법을 "설명"하는 데 더 적합할 수 있다고 주장합니다.

DeepMind의 AlphaFold2 및 AlphaGo와 유사한 기호-신경망 하이브리드 시스템인 AlphaGeometry는 기호 조작과 신경망의 두 가지 방법을 결합하는 것이 일반적인 인공 지능을 찾는 가장 좋은 방법임을 증명할 수 있습니다.

"우리의 장기적인 목표는 수학에서 범용적인 AI 시스템을 구축하고, 범용 AI 시스템이 의존하는 복잡한 문제 해결 및 추론 기능을 개발하는 동시에 인간 지식의 한계를 확장하는 것입니다."라고 Trinh과 Luong은 썼습니다. "이 접근 방식은 미래의 인공 지능 시스템이 수학과 기타 분야에서 새로운 지식을 발견하는 방법을 형성할 수 있습니다."