중국정보통신기술원(China Academy of Information and Communications Technology)은 모델과 국내 소프트웨어 및 하드웨어 간의 심층적인 협력을 촉진하고 산업 구현을 가속화하기 위해 DeepSeek V4의 현지화 적응 테스트를 공식적으로 시작했다고 오늘 발표했습니다.이 테스트는 산업 정보 기술부의 핵심 연구소와 AISHPerf 벤치마크 시스템을 기반으로 수행되었으며 칩, 서버, 올인원 머신, 클러스터, 개발 도구 체인 및 지능형 컴퓨팅 플랫폼과 같은 풀 스택 AI 소프트웨어 및 하드웨어 제품을 다루며 전체 DeepSeek V4 모델 시리즈의 추론 및 미세 조정 프로세스에 중점을 둡니다.
평가는 적응 용이성, 기능적 완성도, 최적화 효과, 성능, 비용 등 5가지 차원에서 평가하며, 시퀀스 처리, 코드 능력, 에이전트 호출 성공률, 태스크 디스어셈블리 등 특수 지표를 새롭게 추가해 3차원 평가 시스템을 구성한다.
DeepSeek V4는 출시 당일 여러 국내 하드웨어에 대한 Day-0 적응을 달성하여 국내 AI 소프트웨어 및 하드웨어가 동일 주파수 반복 단계에 진입했음을 나타냅니다.
이번 테스트는 적응 수준을 객관적으로 검증하고, 국내 컴퓨팅 파워에 대한 지원을 강화하며, 독립적이고 제어 가능한 AI 생태계 구축을 가속화할 예정이다.
DeepSeek V4에는 V4-Pro(플래그십 에디션)와 V4-Flash(라이트웨이트 에디션)의 두 가지 버전이 포함되어 있습니다. 두 버전 모두 기본적으로 100만 개의 토큰 초장 컨텍스트(약 750,000단어)를 지원합니다. 그들은 자체 개발한 DSA 희소 주의 메커니즘을 채택하여 백만 개의 컨텍스트에 대한 추론 비용을 70% 줄이고 메모리 사용량을 40% 줄입니다.
V4-Pro: 총 매개변수는 1조 6천억에 도달하고 활성화 매개변수는 49B입니다. 최고 성능 한계, GPT-5 및 Claude Opus와 같은 세계 최고의 비공개 소스 모델에 대한 벤치마크에 중점을 두고 있으며 복잡한 추론, 코드 생성, 과학적 연구 계산 및 기타 어려운 작업에 적합합니다.
V4-Flash: 총 매개변수 284B, 활성화 매개변수 13B, 고효율 및 저비용, Pro 버전에 가까운 추론 능력, 더 빠른 속도, 저렴한 가격, 일상적인 상호 작용, 콘텐츠 생성, 엔터프라이즈 경량 배포 및 기타 시나리오에 적합합니다.
