DeepSeek V4가 공식적으로 출시될 예정이며 피크 시간대에는 API 가격이 두 배가 됩니다

6월 29일, DeepSeek이 사용자에게 보낸 업그레이드 알림 이메일에는 DeepSeek V4의 공식 버전이 7월 중순에 공식 출시될 예정이며, 이를 통해 더 많은 기능 최적화 및 성능 개선은 물론 최고 가격 및 최저 가격 메커니즘이 제공될 것이라고 밝혔습니다. 이메일에 따르면 매일 베이징 시간 9시~12시, 14시~18시가 피크 시간으로 기재돼 있으며 통화 요금은 평소 요금의 2배다. 동시에 DeepSeek은 관련 조정이 이루어지기 24시간 전에 이메일을 통해 사용자에게 알릴 것이라고 밝혔습니다.

'가격 인상' 전 '영구적 가격 인하'

DeepSeek이 올해 가격을 조정한 것은 이번이 처음이 아닌 것으로 알려졌습니다. 공식 API 문서에 따르면 DeepSeek은 백만 개의 토큰 단위로 요금이 청구되며 캐시 적중, 캐시 누락 및 출력 토큰을 기준으로 별도로 요금이 청구됩니다. 동시에 DeepSeek V4 시리즈 자체에는 높은 컴퓨팅 성능 요구 사항이 있습니다.

4월 24일 DeepSeek이 V4 Preview를 출시했을 때 V4 Pro에는 총 매개변수 1조 6천억 개, 활성화 매개변수 490억 개가 있고, V4 Flash에는 총 매개변수 2,840억 개, 활성화 매개변수 130억 개가 있다고 밝혔습니다. 둘 다 1백만 개의 토큰 컨텍스트를 지원합니다.

공식 문서에는 V4 Flash의 동시성 제한이 2500이라고 나와 있습니다. V4 Pro의 고성능 모델은 동시성 제한이 500이고 공급 탄력성이 Flash보다 약합니다.

5월 23일, DeepSeek은 V4 Pro의 기존 75% 할인을 영구 가격으로 전환하고, API 수수료를 이전 최대 24위안/백만 토큰에서 최대 6위안/백만 토큰으로 인하한다고 발표했습니다. 당시 시장에서는 화웨이 어센드 950 칩 공급 증가와 관련이 있을 것이라는 추측이 나왔으나 딥식은 이에 응하지 않았다.

영구 가격 인하 후 V4 Pro의 현재 정상 가격은 캐시 적중 입력의 경우 0.025위안/백만 토큰, 캐시 미스의 경우 3위안/백만 토큰, 출력의 경우 6위안/백만 토큰입니다. V4 Flash의 해당 가격은 각각 0.02위안, 1위안, 2위안입니다. 피크 시간대에는 가격이 두 배로 오르지만 이전에 출시된 것보다 여전히 낮습니다.

일반 사용자의 경우 이러한 조정이 채팅 애플리케이션 요금 변경에 직접 반영되지 않을 수 있습니다. 주로 영향을 받는 대상은 API를 통해 DeepSeek 모델에 액세스하는 개발자, AI 애플리케이션 회사 및 기업 고객입니다.

V4 Pro를 예로 들면, 출력 토큰을 계산할 때 AI 애플리케이션이 피크 시간대에 하루에 1억 개의 출력 토큰을 소비한다면 정상 비용은 약 600위안이고 피크 가격은 약 1,200위안입니다. 하루에 10억 개의 출력 토큰을 소비하면 비용은 약 6,000위안에서 12,000위안으로 증가합니다. 고객 서비스, 코드 도우미, 사무실 상담원, 검색 기능이 강화된 Q&A 등 빈도가 높은 애플리케이션의 경우 가격을 두 배로 올리면 총 이익 마진과 통화 전략에 직접적인 영향을 미칠 수 있습니다.

저가 노선을 포기하는 것이 아니다

현재 DeepSeek의 피크 앤 밸리 가격 도입은 저가 노선을 포기한다는 의미는 아닙니다. 좀 더 정확하게 말하자면, DeepSeek은 컴퓨팅 자원을 사용 기간에 따라 다시 계층화함으로써 저가 전략이 통일된 저가에서 정제된 저가로 바뀌기 시작했습니다.

토큰 가격으로만 판단할 때 DeepSeek은 성수기 및 최저기 도입 이후에도 여전히 저가 "정말 향기로운" 범위에 있으며 국제 시장에서 여전히 매우 경쟁력이 있습니다. 이것이 DeepSeek의 가격 인상 이유이기도 합니다.

DeepSeek English API 가격 페이지에 따르면 V4 Pro의 출력 가격은 토큰 백만 개당 US$0.87이며, 이는 피크 두 배를 기준으로 약 US$1.74입니다. 이와 대조적으로 OpenAI의 공식 가격 페이지에는 GPT-5.5의 표준 API 가격이 입력의 경우 5달러, 캐시 입력의 경우 0.5달러, 출력/백만 토큰당 30달러인 것으로 나와 있습니다. Anthropic의 Claude Opus 4.8의 정상 가격은 입력의 경우 5달러이고 출력/백만 토큰의 경우 25달러입니다.

출력 토큰만 보면 OpenAI 및 Anthropic의 고급 모델 가격은 여전히 DeepSeek V4 Pro 최고 가격의 14~17배 정도입니다.

한편, 해외 시장에서는 대형 모델의 가격 책정 모델이 고정 구독에서 토큰 결제로 전환되면서 기업의 사용 비용이 급격히 상승하기 시작했습니다. 예산이 제한된 많은 해외 기업에서는 DeepSeek과 같은 저가형 모델에 대한 문의가 늘어나고 있습니다.

이전 보고서에 따르면 택시 호출 소프트웨어 Uber를 예로 들어 보겠습니다. 대형 모델 가격 책정 모델이 변경된 후 회사의 1년 AI 예산이 불과 4개월 만에 빠르게 소진되어 회사에서는 임원의 사용을 제한해야 했습니다. "AI에 대한 돈 낭비를 멈춘 최초의 대기업"이 된 것은 행운이었습니다.

Microsoft, Coinbase 및 기타 회사의 경영진도 많은 기업 작업에 항상 가장 비싸고 가장 큰 모델이 필요한 것은 아니라는 점을 강조하기 시작했습니다. 이러한 변화로 인해 기업은 더 많은 "다중 모델 라우팅"을 채택하게 되었습니다. 즉, 간단한 작업을 저렴한 모델에 할당하고 복잡한 작업을 고급 모델에 할당하는 것입니다.

따라서 OpenRouter 데이터에 따르면 오픈 소스 모델은 해당 플랫폼의 토큰 처리량 중 약 65%를 차지했습니다. 그 중에서도 딥식(DeepSeek)으로 대표되는 중국 내 저가형 모델의 사용이 크게 늘었다. 이는 해외 사용자들이 '가성비 의식' 시대에 돌입했음을 직관적으로 반영한 것이다.