연구원들은 ChatGPT가 특정 단어를 반복하여 민감한 정보를 유출할 수 있음을 발견했습니다

Google 연구진은 OpenAI의 인공지능 챗봇 ChatGPT가 훈련 데이터에서 실제 사람의 개인정보 등 민감한 정보를 유출할 수 있다는 사실을 발견했습니다. ChatGPT는 OpenAI가 2022년 11월 30일 출시한 새로운 AI 챗봇 도구인 것으로 알려졌습니다. 사용자 요구 사항에 따라 기사, 이야기, 가사, 산문, 농담, 심지어 코드까지 빠르게 생성하고 다양한 질문에 답변할 수 있습니다.

출시된 지 불과 두 달 만에 ChatGPT는 월간 활성 사용자 수 1억 명에 도달하여 역사상 가장 빠르게 성장하는 소비자 앱 중 하나가 되었습니다. 올해 11월 6일 열린 제1회 OpenAI 개발자 컨퍼런스에서 OpenAI CEO 샘 알트만(Sam Altman)은 ChatGPT의 주간 활성 사용자 수가 1억 명에 도달했다고 발표했습니다.

소위 모든 LLM(대형 언어 모델)과 마찬가지로 ChatGPT를 지원하는 기본 기계 학습 모델은 인터넷에서 스크랩한 대량의 데이터를 사용하여 교육됩니다. 그러나 걱정스럽게도 추출된 훈련 데이터 중 일부에는 이름, 이메일 주소, 전화번호 등 실제 사람에 대한 식별 정보가 포함되어 있었습니다.

Google 연구원들은 ChatGPT가 "영원히" 특정 단어를 반복하도록 요청하여 훈련에 사용되는 일부 데이터를 공개하도록 하는 방법을 찾았습니다. 데이터에는 개인 정보(예: 개인 이름, 이메일, 전화번호 등), 연구 논문 및 뉴스 기사의 일부, Wikipedia 페이지 등이 포함되었습니다.

구글 브레인 수석연구원인 캐서린 리(Katherine Lee)는 “7월에 이 취약점을 발견해 8월 30일 OpenAI에 통보했고, 표준 공개 기간인 90일을 지나 취약점을 공개했다”며 “이제 OpenAI에 공개했으니 지금은 상황이 달라졌을 수도 있다”고 말했다. 연구원들은 OpenAI가 8월 30일에 취약점을 패치했다고 밝혔습니다.

외국 언론은 구글 연구원들이 발견한 ChatGPT의 취약점이 특히 민감한 정보가 포함된 데이터 세트에 대해 훈련된 모델의 경우 심각한 개인 정보 보호 문제를 야기했다고 말했습니다.