5월 29일 오후, 많은 네티즌들은 DeepSeek이 재생성 및 수정 가능한 횟수에 제한이 있다는 사실을 발견했습니다. 연속해서 여러 번 수정하거나 재생성하면 페이지에 상한값에 도달했다는 메시지가 표시됩니다. 일부 네티즌들은 일반적인 대화에서는 3~6회 재생성하면 상한선에 도달한다고 보고했다. 전문가 모드에서는 기회가 3번만 있을 수 있습니다. 수정 입력 횟수의 상한은 일반적으로 6회입니다.

현재 DeepSeek은 공식적인 발표를 하지 않았으며 고정된 할당량 테이블을 공개하지도 않았지만 이 문제는 커뮤니티에서 열띤 토론을 불러일으켰습니다. 결국 DeepSeek에는 저를 포함하여 수많은 충성도 높은 사용자가 있습니다. 우리는 가끔 서버 사용량이 많고 페이지 충돌이 발생하는 것을 누구나 이해할 수 있지만 조용히 제한 사항을 추가할 수는 없어 사람들이 당황하게 됩니다.
API는 전혀 영향을 받지 않으므로 친숙한 방법인 인프라 문제일 가능성이 높습니다.

01
컴퓨팅 전력 부족으로 인한 일시적인 전류 제한?
이 제한에 대해 Xiaohongshu의 '반공식 계정' Baiqiang은 다음과 같이 말했습니다. 당황하지 마세요. 이것은 일시적입니다.

이에 따라 "메시지 수정"과 "재생성"이 갑자기 제한되었습니다. DeepSeek이 소위 "부정적 최적화"를 하고 있는 것이 아니라,컴퓨팅 파워 압력이 너무 높을 때 취한 임시 조치.
이 기간, 특히 5월 29일 오후부터 DeepSeek의 사용자 수가 급격히 증가했기 때문에 앱 측의 요청 압력은 명백했습니다. 가장 기본적인 문자 대화를 정상적으로 사용할 수 있도록 우선순위를 지정하고 보장하기 위해 팀에서는 먼저 "메시지 수정" 및 "재생성"과 같은 빈도가 높은 작업만 제한할 수 있습니다.
사용자 인터페이스에서 "재생성"은 버튼 하나만 클릭하면 되고 "메시지 수정"은 원래 질문을 변경하는 것뿐입니다. 하지만 서버의 경우 이 두 가지는 단순한 새로 고침이 아니라 새로운 추론 요청입니다. 사용자가 재생성을 위해 클릭할 때마다 모델은 컨텍스트를 다시 처리하고 답변을 생성해야 합니다. 메시지를 수정하는 경우에도 마찬가지입니다. 원래 질문이 변경되는 한 모델은 새로운 입력을 기반으로 다시 대답해야 합니다.
따라서 다수의 사용자가 동시에 반복적으로 클릭하고 "재생성"을 무한 카드 뽑기 버튼으로 취급하면 이러한 요청은 서버에 큰 부담이 됩니다.
이 문제는 DeepSeek의 최근 변경 사항과 함께 볼 수 있습니다. 예를 들어 전문가 모드 파일 업로드 및 목록 삭제, 스마트 검색 기능 꺼짐, 때때로 "서버 사용량"이 발생하는 이유는 실제로 컴퓨팅 리소스가 부족하기 때문입니다.전반적인 서비스 압력이 너무 높아서 절충이 필요합니다.

DeepSeek은 사용하기 매우 쉬우므로 기본 인프라가 이를 따라잡아야 합니다.
"메시지 수정" 또는 "재생성"이 상한선에 도달하는 상황에 대해 Baiqiang의 조언은 계속해서 빠르게 클릭하지 말라는 것입니다. 먼저 중단하고 15~30분 정도 기다린 후 다시 시도해 보세요. 계정에 따르면 대부분의 경우 대기 후 제한이 자동으로 복원됩니다. 반복해서 빠르게 클릭할 경우 시스템에서 비정상적으로 빈도가 높은 요청으로 인식하여 제한 시간이 길어질 수 있습니다.
Bai Qiang은 또한 Huawei의 새로운 Ascend 슈퍼 노드 카드가 배포되고 있으며 올해 하반기에 온라인에 출시될 것으로 예상된다고 언급했습니다. 그때쯤이면 컴퓨팅 성능이 크게 확장될 것이며 이러한 일시적인 제한이 해제될 가능성이 높습니다.
그러나 DeepSeek은 아직 이 문제에 대해 공식적으로 발표하지 않았습니다. 제한 횟수, 복구 시간, 하반기 컴퓨팅 파워 확장 이후 구체적인 변경 사항 등을 포함하면 아직 추가적인 공식 확인을 기다려야 할 것으로 보인다.
02
DeepSeek은 고립된 사례가 아닙니다.
사실 DeepSeek가 이 작업을 수행한 최초의 AI 회사는 아닙니다.
대형 모델 제품의 컴퓨팅 성능이 부족하거나, 사용자가 급증하거나, 피크 기간 동안 압력이 너무 높은 경우 일반적인 관행은 현재 흐름을 제한하거나, 다운그레이드하거나, 큐에 넣거나, 일부 고소비 기능을 별도로 제한하는 것입니다.
ChatGPT에는 항상 메시지 제한이 있었으며 유료 사용자라도 수요가 많은 기간에는 사용 제한이 발생할 수 있습니다. 무료 사용자가 고급 모델 할당량에 도달한 후에도 계속 사용할 수 있도록 더 가벼운 모델로 전환됩니다.
이는 일종의 "서비스 다운그레이드"로 이해될 수 있습니다. 이는 사용이 허용되지 않는다는 의미가 아니라 모든 사람이 가장 비싸고 리소스 집약적인 기능을 무제한으로 사용할 수 없다는 의미입니다.

Claude와 유사하게 Anthropic은 다양한 사용자에 대한 사용 예산을 설정하고 Claude Code 및 API와 같은 빈도가 높은 시나리오도 용량 변경에 따라 상한을 조정합니다. 컴퓨팅 능력이 풍부하면 할당량을 늘릴 수 있습니다. 수요 압력이 증가하면 제한 사항이 더욱 분명해집니다.
앤트로픽은 지난 5월 6일 새로운 컴퓨팅 파워 협력과 용량 증가로 클로드 코드(Claude Code)와 클로드 API(Claude API)의 사용 제한을 늘렸다는 특별 문서도 발표했다. 차례로, 그것은 또한 다음을 보여줍니다.사용량 한도는 컴퓨팅 파워 용량과 직결됩니다. 컴퓨팅 파워가 빡빡하면 조여지고, 컴퓨팅 파워가 확장되면 완화됩니다.

그러나 Anthropic은 이제 다양한 구독 할당량에 대해 더 자세한 사용 제한을 설정했으며 Claude Code와 같은 고소비 시나리오는 토큰 측정 및 청구 논리에 가까워지고 있습니다.
이미지 및 비디오 생성 제품이 더 일반적입니다. Sora와 Gemini의 이미지 생성 기능은 물론 다른 AI 영상 도구들도 수요가 급증할 때 세대 수의 긴축, 대기열 시간의 길어짐, 무료 할당량이 줄어드는 시간을 경험해 왔습니다.
"모든 추론에는 비용이 발생한다"는 것은 AI 제품에 있어서 피할 수 없는 현실이 되었다고 할 수 있습니다.
얼마 전, 콩주머니 충전이 논란을 불러일으켰습니다. 한때 웨이보에서는 "두바오(Doubao), 비싸고 사용하기 어렵다"가 인기 검색어가 되었습니다. 이번에 DeepSeek의 제한된 기능과는 다르지만 사용자 반응의 논리는 동일합니다. AI 제품이 저렴하고 사용하기 쉽다는 점은 모두가 익숙하다는 것입니다. 플랫폼이 충전을 시작하거나 특정 기능을 제한하기 시작하면 사용자 감정이 쉽게 반등합니다.
기본 기능을 무료로 제공하고, 복잡한 기능에 대해서는 과금을 시작하고, 고비용 기능에 대해서는 할당량을 설정하고, 피크 기간 동안 흐름을 일시적으로 제한하는 것은 실제로 AI 기업이 매우 일반적인 관행입니다.
DeepSeek은 "재생성" 및 "수정 메시지"의 수를 제한하는데, 이는 전체 AI 산업에서 드문 일이 아닙니다. 제한하는 것은 채팅 입장이나 모델 자체가 아니라 사용자가 자주 클릭하기 쉬운 작업이지만 클릭할 때마다 추론 리소스가 다시 소비됩니다.
기본적인 대화 내용을 최대한 보존해야 하기 때문에 이것이 사용자가 제품을 사용할 수 있는 가장 중요한 요소입니다. 그러나 재생성, 반복 수정, 파일 업로드, 인터넷 검색, 긴 컨텍스트 및 다중 모드 생성과 같은 기능은 모두 압력이 높을 때 제한되거나 다운그레이드될 가능성이 높습니다.
이번 논란의 초점은 '얼마나 제한할 것인가'가 아니라 '어떻게 제한할 것인가'에 있다고 생각합니다.
만약 공무원이 이것이 일시적인 전류 제한이고 재개하는 데 걸리는 시간과 영향을 받는 작업이 무엇인지 미리 설명할 수 있다면 사용자는 이를 더 많이 받아들일 가능성이 높습니다.하지만 예고 없이 갑자기 사용할 수 없게 된다면 당연히 기능이 축소되는 것은 아닌지, 앞으로 요금이 부과되는 것은 아닌지 모두가 즉시 궁금해할 것입니다.
AI 제품이 얼리 어답터 도구에서 일상 도구로 바뀌면 사용자는 안정성과 투명성에 점점 더 관심을 갖게 될 것입니다. 제한 사항 자체는 이해할 수 있지만 처음으로 팝업 창을 통해 사용자에게 알리지 않는 것이 가장 좋습니다.
DeepSeek은 사용 횟수가 너무 많아 제한해야 한다면, 이는 또한 여러분을 기다리는 사용자가 많다는 것을 의미한다는 것을 알아야 합니다.
비록 그것이 단지 승인서일지라도.