12월 27일 이른 아침, OpenAI는 다음과 같이 발표했습니다.챗봇 ChatGPT, 동영상 생성 모델 Sora 및 API에 중대한 오류가 발생했습니다. 대부분 몇 시간 동안 다운됐으나 문제가 확인돼 복구가 시작됐다. 중단은 12월 26일 동부 표준시 오후 1시 30분경에 시작되었습니다. 네트워크 상태 모니터링 웹사이트 DownDetector에 따르면 오후에 15,000명 이상의 사용자가 주로 ChatGPT와 관련된 문제를 보고했습니다. 같은 날 저녁에는 신고 건수가 700건 미만으로 떨어졌습니다.


OpenAI는 ChatGPT, API 및 Sora가 현재 오류율이 높으며 이 문제는 업스트림 공급자에 의해 발생한다는 보고서를 즉시 발행했습니다.


이미지 출처: OpenAI

이전 언론 보도에 따르면 OpenAI는 문제와 관련된 '업스트림 공급자'를 지정하지 않았지만 독점 클라우드 공급자인 Microsoft는 데이터 센터 중 하나에 '전원 문제'가 있다고 보도했습니다. 해당 문제는 OpenAI 문제와 동시에 발생해 북미에도 영향을 미쳤다. 동시에 Xbox 클라우드 게임에도 문제가 있었습니다. 오후 5시가 막 지나서야. 12월 26일(동부 표준시), 마이크로소프트는 영향을 받은 데이터 센터의 전원을 "완전히 복구"했다고 밝혔습니다.


올 여름 말 기준으로 ChatGPT의 일일 활성 사용자 수는 2억 명이 넘습니다. ChatGPT를 포함한 인기 있는 OpenAI 제품은 출시 이후 여러 차례 중단을 경험했습니다.

가장 최근의 대규모 중단은 소라 출시 며칠 후인 12월 11일에 발생했습니다. ChatGPT, API, Sora를 포함한 OpenAI의 모든 서비스는 12월 11일 오후 3시 16분부터 오후 7시 38분(태평양 표준시)까지 4시간 이상 심각한 성능 저하를 경험하거나 심지어 완전한 사용 불가능 상태를 경험했습니다. 이 중단은 새로 배포된 원격 측정 서비스의 잘못된 구성으로 인해 발생했으며, 이로 인해 전 세계 수백 개의 Kubernetes 클러스터 제어 플레인에 과부하가 발생하여 중요한 시스템에 연속적인 오류가 발생했습니다.