DeepSeek-V3.1 공식 출시: 더욱 강력한 에이전트 기능

오늘 DeepSeek은 DeepSeek-V3.1이 공식 출시되었다고 공식 발표했습니다. 보고서에 따르면 이 업그레이드에는 다음과 같은 주요 변경 사항이 포함됩니다. 하이브리드 추론 아키텍처: 하나의 모델이 사고 모드와 비사고 모드를 모두 지원합니다. 더 높은 사고 효율성: DeepSeek-R1-0528에 비해 DeepSeek-V3.1-Think는 더 짧은 시간에 답변을 제공할 수 있습니다. 더욱 강력한 에이전트 기능: 사후 교육 최적화를 통해 도구 사용 및 에이전트 작업에 대한 새 모델의 성능이 크게 향상되었습니다.

공식 앱과 웹 모델이 DeepSeek-V3.1로 동시에 업그레이드되었습니다. 사용자는 'Deep Thinking' 버튼을 통해 사고 모드와 비사고 모드를 자유롭게 전환할 수 있습니다.

프로그래밍 에이전트: 코드 복구 평가 SWE 및 명령줄 터미널 환경의 복잡한 작업(Terminal-Bench) 테스트에서 DeepSeek-V3.1은 이전 DeepSeek 시리즈 모델에 비해 크게 향상되었습니다.

검색 에이전트: DeepSeek-V3.1은 여러 검색 평가 지표에서 큰 개선을 이루었습니다. 다단계 추론이 필요한 복합 검색 테스트(browsecomp)와 다분야 전문가 수준 난이도 테스트(HLE)에서 DeepSeek-V3.1의 성능이 R1-0528보다 대폭 앞섰습니다.

테스트 결과에 따르면 사고 체인 압축 훈련 후 V3.1-Think의 다양한 작업에 대한 평균 성능은 R1-0528과 동일하지만 출력 토큰 수가 20%-50% 감소한 것으로 나타났습니다. 동시에 V3.1의 무사고 모드 출력 길이도 효과적으로 제어되었습니다. DeepSeek-V3-0324와 비교하여 출력 길이를 크게 줄이면서 동일한 모델 성능을 유지할 수 있습니다.

또한, 9월 6일 이른 아침부터 DeepSeek 오픈 플랫폼 API 인터페이스 호출 가격이 다음과 같이 조정됩니다.