Quick Technology는 대형 모델인 DeepSeek V4 시리즈가 4월 24일 공식 출시되었다고 5월 3일 보도했습니다. 지난해 DeepSeek R1 업데이트 이후 15개월 만입니다. V4의 성능은 국내외에서도 논의를 불러일으켰고, 미국인들도 큰 우려를 표하고 있다.
DeepSeek V4의 기능을 평가하기 위한 많은 테스트가 있었습니다. 미국 외교협회 선임연구원 3명이 정리한 기존 연구보고서에 따르면 미국 상위 대형 모델에 비해 약 7개월 정도 뒤처지는 것으로 나타났다.
이제 국립표준기술원(NIST) 산하 인공지능표준혁신센터(CAISI)도 DeepSeek V4를 평가하기 위해 왔습니다. 그들의 결론은 DeepSeek V4가 미국보다 약 8개월 정도 뒤처져 있다는 것인데, 이는 이전 격차와 비슷합니다.

AI 역량 평가 결과 DeepSeek V4는 800점을 기록했으며, 현재 가장 강력한 것은 GPT-5.5로 1200점 이상, GPT-5.4와 Opus 4.6도 1000점 이상을 기록했습니다. 포인트.
DeepSeek V4의 전반적인 성능은 8개월 전 GPT-5와 유사하지만 DeepSeek 관계자는 이전에 출시 보고서에서 GPT-5.4와 유사하다고 간주했습니다.
그러나 CAISI는 또한 DeepSeek V4가 그들이 평가한 중국에서 가장 강력한 대형 AI 모델이며 네트워크, 소프트웨어 공학, 자연 과학, 추상 추론 및 수학의 5개 분야에서 9가지 테스트에서 매우 강력하다고 인정했습니다.

더 중요한 것은 DeepSeek V4가 더 비용 효율적이라는 것입니다. 미국에서 가장 비용 효율적인 GPT-5.4 소형 대형 모델과 비교해도 DeepSeek V4는 7개 벤치마크 중 4개 벤치마크에서 41%~53% 더 높은 테스트 비용을 보였습니다.
