요 며칠간 국내 AI 폭발이 있었습니다. GLM-5, 미니맥스 2.5, DeepSeek 모두 지난 11일 같은 날 대형 신형 모델을 출시했는데, 그중에서도 당연히 DeepSeek가 가장 큰 관심을 끌었다. 이전에 이전 DeepSee V3 시리즈는 이전 V3 시리즈 대형 모델보다 7배 높은 128K인 반면 이번 ​​업데이트는 주로 컨텍스트 기능을 향상시켜 1M에 도달했다고 보고한 바 있습니다.

DeepSeek도 오늘 밤 공식 그룹에서 이 사실을 공식적으로 확인했습니다.웹페이지와 APP 버전이 새로운 긴 텍스트 모델 구조를 테스트하고 1M 컨텍스트를 지원함을 나타냅니다.

동시에 DeepSeek은 API 서비스가 변경되지 않았음을 강조했습니다. 여전히 V3.2 시리즈 대형 모델이며 128K 컨텍스트만 지원합니다.

DeepSeek 도입으로 판단하면 이 새로운 모델은 여전히 ​​텍스트 모델입니다. 주요 개선 사항은 상황별 기능이며, 이는 많은 분야에서도 매우 중요합니다. 긴 대화 중에 대형 모델은 맥락이 부족하여 이전 내용을 기억하지 못하는 경우가 많습니다.

인터넷에서 이 DeepSeek 대형 모델이 프로그래밍, 출력 속도 등의 측면에서 크게 향상되었음을 보여주는 많은 실제 테스트가 있었지만하지만, 이전 기대에 비하면 이번 업데이트는 다소 실망스러울 수밖에 없습니다.

이번 대형 모델은 분명히 V4가 아니지만 V4 Lite일 가능성이 더 높습니다. 왜냐하면 매개변수 수가 2,000억 개에 불과한 것으로 보고되어 V3 시리즈의 6,700억 개보다 훨씬 적기 때문에 일부 기능이 V3보다 떨어지는 것이 정상입니다.

이 모델은 V4 lite로 추측됩니다. DeepSeek가 앞으로 하나의 대형 V4 모델만 출시할 가능성은 낮습니다. 대신, 다른 버전이 있을 것입니다. 각 시리즈마다 방향과 디자인이 다릅니다. 현재 V4 Lite는 단지 길잡이일 뿐이라 개선점이 별로 없습니다. 더욱이 DeepSeek 관계자는 기술 아키텍처를 자세히 설명하지 않았으며 아직 더 많은 정보가 공개되지 않았습니다.

소문난 DeepSeek V4 전혈 버전에는 V3 시리즈보다 두 ​​배 이상 많은 1조 5천억 개의 매개변수가 있습니다.DeepSeek에서 이전에 연구한 Engram 및 mHC와 같은 새로운 기술도 사용됩니다.비용은 여전히 ​​낮으면서 성능은 포괄적으로 향상됩니다. 이 기대는 여전히 매우 높습니다.