ChatGPT에서는 올해 4월부터 데이터 유출 문제가 발견되었습니다. 공격자는 프롬프트 주입 공격 중에 이미지 Markdown 렌더링을 사용할 수 있습니다. OPENAI는 필요한 검증을 수행하지 않기 때문에 공격자가 사용자 세션의 콘텐츠를 획득하여 타사 서버로 보낼 수 있습니다.

보안 연구원 wunderwuzzi가 발표한 소식에 따르면 OPENAI는 이러한 문제를 복구하기 시작했지만 완전한 복구는 아니지만 완화 계획이 배포되었습니다.

현재 구현된 완화 솔루션은 ChatGPT 웹 버전에만 적용 가능합니다. 서버가 하이퍼링크가 포함된 이미지 태그를 반환하면 ChatGPT는 이미지를 표시하기 전에 확인 API를 호출합니다. 호출은 url_safe라는 엔드포인트이며 대상 URL을 쿼리 매개변수로 추가합니다. 실제로는 잘못된 결과를 반환합니다. 즉, 이미지를 렌더링하지 않고 공격자의 서버에 데이터를 보내지 않습니다.

그러나 이 완화 솔루션은 완전하지 않습니다. 테스트에 따르면 도메인의 다른 이미지가 여전히 렌더링되는 경우가 있으며 ChatGPT는 Bing 검색을 통해 이미지가 존재하는지 확인, 추적 기능 또는 기타 기능이 있는지 확인하는 등 이미지에 대한 네트워크 쿼리를 수행합니다.

검토 후 연구원들은 텍스트를 개별 문자로 분할하고 각 문자에 대한 요청을 생성하는 등 데이터를 계속 전송할 수 있는 방법이 있음을 발견했습니다. 이 방법은 데이터를 훔칠 수도 있지만 매우 비효율적이고 매우 느립니다.

물론, 이제 OPENAI가 이 문제를 다루기 시작했기 때문에 추후에 더 많은 대책이 자연스럽게 전개되겠지만, 이 문제를 완전히 해결하려면 더 많은 시간이 걸릴 수도 있습니다.