DeepSeek V4는 춘절 기간 동안 출시되지 않았지만 DeepSeek은 2월 11일에 DeepSeek V4 Lite라는 새로운 모델을 출시했습니다. 이 모델은 매개변수가 2,000억 개에 불과하고 규모가 상대적으로 작습니다. DeepSeek V4 Lite의 주요 기능은 1M 컨텍스트입니다. 이전 네티즌 테스트에서는 매우 긴 맥락을 제외하면 성능이 그다지 인상적이지 않았습니다. 결국, 매개변수 척도는 주류 대형 모델의 그것과 많이 다릅니다.
그러나 DeepSeek V4 Lite는 출시 이후 조용히 업그레이드되었습니다. 2월 27일 일부 네티즌이 테스트한 결과 성능이 점점 더 강력해지고 있음을 발견했습니다. 어제 또 업그레이드 됐네요. Linux Do 커뮤니티의 리더인 HCPTangHY도 테스트 후 좀 놀랍다며 충격을 받았습니다. 그의 테스트에서는 이미 국가 모델인 SOTA였습니다(참고: SOTA를 먼저 고려하면 됩니다).
그뿐만 아니라 훈련이 계속된다면 오픈소스가 클로즈드소스를 활용하는 것도 가능하다.

그의 테스트에 따르면 DeepSeek V4 Lite의 0302 업그레이드 점수는 이전 0227 버전보다 한 단계 더 높습니다.이미 현재 최고 대형 모델인 소네트 4.6에 가깝다.
해당 게시물에는 업계에서 잘 알려진 기상 카드 테스트를 포함하여 다른 게임 및 프런트엔드 테스트도 있습니다. DeepSeek V4 Lite 0302 버전은 미적 측면과 기능성 측면 모두에서 온라인 상태입니다.
지난 1년간 대형 AI 모델을 돌이켜보면 국내 대형 모델은 더 이상 대화와 채팅 측면에서 비공개 소스 모델과 크게 다르지 않습니다.그러나 다중 양식, 프로그래밍, 수학 및 지능형 에이전트와 같은 측면에서는 뒤쳐져 있습니다.최근 출시된 GLM5, 미니맥스 2.5, Qwen 3.5 시리즈 등이 개선됐지만, 앤트로픽(Anthropic), 오픈AI(OpenAI), 구글도 최신 모델을 출시하며 격차가 다시 벌어졌다.
상위 비공개 소스 모델을 따라잡는 데 있어 국내 기업은 많은 불리한 점에 직면해 있습니다. 미국 기업만큼 투자를 많이 하지 않고, 컴퓨팅 파워도 부족하다. 데이터는 Google이나 OpenAI만큼 좋지 않습니다. 결국 그들은 수년간 축적되었거나 많은 수의 사용자를 보유하고 있습니다.
또한 Anthrpoic은 데이터 수집을 위해 불법 복제 웹사이트에서 대량의 도서를 다운로드했으며 미화 15억 달러의 보상금을 지불하라는 명령을 받았습니다. 이는 그들이 이 분야에 얼마나 투자했는지, 얼마나 뻔뻔한지 보여줍니다.
마을 전체의 희망인 DeepSeek은 기술 탐구의 기준을 세웠습니다. 2,000억 개의 작은 매개변수를 갖춘 DeepSeek V4 Lite가 이와 같은 성능을 발휘한다면 DeepSeek V4 정식 버전은 정말 기대할 가치가 있습니다. 출시 후에는 필연적으로 미국 AI에 큰 영향을 미칠 것입니다.



