국내 대형 모델은 지난주에 자주 업그레이드되었습니다. GLM-5.1 및 MiniMax 2.7의 오픈 소스에 이어 Dark Side of the Moon의 Kimi K2.6 코드 미리보기도 제공됩니다. AI 프로그래밍에 특별히 최적화된 수조 개의 매개변수를 갖춘 대형 모델입니다. 공식 홈페이지에는 이미 온라인 상태라고 나와 있습니다.하지만 이 대형 모델을 경험하려면 월 39위안부터 시작하고 키미코드에서 사용할 수 있는 키미의 멤버십 플랜이 필요하다.

그러나 K2.6 코드 미리보기 대형 모델은 상대적으로 키가 낮습니다. 이전 내부베타에 대해서는 별다른 홍보가 없었습니다. 지난 이틀 동안 출시되었을 때만 누군가 그것을 언급하는 것을 보았습니다. 키미 관계자는 별다른 팡파르로 홍보하지 않았다. 공식 웹사이트에서도 이 대형 모델에 대한 구체적인 업그레이드는 아직 확인되지 않았습니다.
인터넷에서 사람들이 참여한 내부 베타 피드백과 소개로 판단하면, K2.6 코드 미리보기는 수조 개의 매개변수가 있는 대형 모델인 K 2.5를 기반으로 개선되었습니다. 주요 최적화는 여전히 AI 프로그래밍입니다. SWE-Bench Verified 목록 점수 K 2.5는 76.8%, LiveCodeBench는 85%입니다.
K2.6 코드 미리보기의 개선 방향은 주로 추론의 깊이, 에이전트 계획의 품질 및 다단계 도구 호출의 신뢰성입니다.일부 내부 테스터는 사고 체인이 Opus 스타일을 가지고 있다고 말했습니다(이것은 매우 심오합니다).

구체적인 수준에 대해서는 스스로 프로그래밍 능력 평가를 실시한 거물 Versun이 있습니다.K2.6-code-preview의 점수는 89점으로 K 2.5의 83점보다 6점 높다.하지만 여전히 역대 상위권 선수들 사이에는 격차가 존재한다.
프로모션 자료에서 항상 Opus 4.6을 따라잡거나 능가할 것이라고 말하는 다른 제조업체와 비교할 때 K2.6 코드 미리보기의 일부 네티즌은 현재 이를 Sonnet 4.6 수준으로 평가하고 있으며 이 역시 매우 강력합니다.

사용해본 네티즌들의 평가는 여전히 좋다. 지시를 따르는 능력도 나쁘지 않고, 능력도 좋습니다. 이제 Kimi의 Coding Plan 패키지와 결합되어 최소한 AI 프로그래밍을 위한 강력하고 비용 효율적인 옵션을 제공합니다.