미국 카네기멜론대학교의 새로운 연구는 인공지능 시스템이 더욱 지능화되면서 그들의 행동이 점점 더 이기적이 되고, 증가된 추론 능력이 협력을 희생할 수 있다고 경고합니다. 이번 연구는 카네기멜론대학교 인간-컴퓨터 상호작용 연구소(HCII)의 박사과정 학생인 Li Yuxuan과 Bai Toichi 부교수가 공동으로 완료했습니다.


이 연구는 HCII 박사과정 학생 Yuxuan Li와 부교수 Hirokazu Shirado가 공동으로 완료했습니다. 보고서는 LLM의 추론 능력이 강할수록 그들의 자기 추구 행동이 더욱 분명해질 것이라고 지적합니다. 이러한 행동은 분쟁이나 사회 문제를 해결하는 인공지능의 성능에도 영향을 미칠 수 있습니다. 따라서 연구자들은 AI 개발을 촉진할 때 시스템의 지능과 속도를 추구하는 것뿐만 아니라 사회적 지능 함양에도 초점을 맞춰야 한다고 말합니다.

지능형 시스템이 개인간 분쟁 조정, 결혼 상담 등 사회 분야에 점점 더 많이 참여함에 따라 연구자들은 복잡한 추론을 갖춘 AI 모델이 "이기주의"를 조장하는 제안을 제공할 수 있다는 사실을 발견했습니다. Li Yuxuan은 "AI 행동이 인간과 유사해짐에 따라 사용자는 AI를 실제 의사소통 파트너로 간주하는 경향이 있습니다. 사람들은 AI가 감정적 상호 작용 중에 '감정적 치유자' 역할을 하도록 허용할 수 있습니다. 그러나 AI가 사회적 또는 관계 문제를 다룰 때 더 이기적이게 되면 AI에게 결정을 내리는 사용자에게는 이것이 위험이 됩니다."라고 말했습니다.

실험에서 Li Yuxuan과 Bai Huyi는 경제 게임을 통해 협력 시나리오를 시뮬레이션하고 추론 기능이 있거나 없는 LLM을 테스트했습니다. 그들은 추론 모델이 작업을 분해하고, 더 복잡한 인간 논리를 반영하고, 통합하는 데 더 많은 시간을 소비하는 경향이 있지만 분명히 협업이 부족하다는 사실을 발견했습니다. 즉, 합리적일수록 협력은 적습니다. 예를 들어, "공공재" 게임에서 두 개의 ChatGPT 모델은 공통 풀에 포인트를 기여할지 여부를 결정해야 합니다. 추론 모델은 리소스의 20%만 공유하려는 반면, 추론이 없는 모델은 최대 96%를 공유합니다.

또한 이 연구에서는 추론 과정에 5~6단계를 추가해도 협력률이 거의 절반으로 감소하는 것으로 나타났습니다. 반성을 기반으로 한 격려조차도 협력 행동을 58% 감소시켰습니다. 그룹 협업 실험에서 추론 모델의 이기적인 행동은 '전염성'이 있어 전체 비추론 모델의 협업 능력이 81% 감소했습니다.

관련 연구 결과에 따르면 추론 AI 모델이 더 똑똑하다고 해서 사회의 더 나은 발전을 촉진할 수 있다는 의미는 아닙니다. AI에 대한 사람들의 신뢰가 높아짐에 따라 학자들은 AI 개발에 있어서 단지 개인의 이익을 극대화하는 데 초점을 맞추는 것이 아니라 '사회적 지능'과 '협동적 행동'을 모두 고려해야 한다고 요구합니다. Li Yuxuan은 "AI의 추론 능력 향상은 이타주의 및 그룹 협력과 균형을 이루어야 합니다. 사회가 개인의 집합이 아닌 그룹의 상생 상황이 되기를 바란다면 AI 시스템의 설계도 순수한 사리 최적화를 넘어서야 합니다."라고 믿습니다.

"언어 모델의 자발적 기부 및 계산된 탐욕"이라는 논문은 다음 달 소주에서 열리는 2025 EMNLP 자연어 처리 컨퍼런스에서 공식 발표될 예정입니다.

/ScitechDaily에서 편집됨