미국 인공지능(AI) 기업 앤트로픽(Anthropic)이 자사 중형 모델 소넷(Sonnet)의 최신 버전인 소넷 4.6(Sonnet 4.6)을 출시한다고 발표하며 4개월에 한 번씩 회사의 반복 리듬을 이어가고 있다. 관계자들은 새 버전이 코드 작성, 지시 따르기, 컴퓨터 작동 측면에서 크게 개선되었다고 밝혔습니다. Sonnet 4.6은 즉시 무료 및 유료 Pro 사용자 모두를 위한 기본 모델이 됩니다.

이번에 출시된 Sonnet 4.6 베타 버전은 이전 Sonnet 시리즈에서 사용할 수 있는 최대 컨텍스트의 두 배인 최대 100만 토큰의 컨텍스트 창을 지원합니다. Anthropic은 이 용량을 "전체 코드 베이스, 긴 계약 또는 단일 요청으로 수십 개의 연구 논문을 수용하기에 충분하다"고 설명합니다. 더 큰 맥락은 모델이 복잡한 엔지니어링 프로젝트, 법률 텍스트 및 학술 자료를 다룰 때 대화에서 더 많은 핵심 정보를 유지할 수 있음을 의미합니다.

Sonnet 4.6의 출시는 고급 모델인 Opus 4.6이 출시된 지 불과 2주 만에 이루어졌으며, 업계에서는 더 작은 Haiku 모델도 앞으로 몇 주 안에 업데이트를 받을 것으로 예상하고 있습니다. 이는 Anthropic이 경량에서 플래그십까지 다양한 사용 시나리오를 포괄하기 위해 다양한 크기 모델을 중심으로 긴밀한 제품 업그레이드 리듬을 유지하고 있음을 보여줍니다.
성능 측면에서 Anthropic은 Sonnet 4.6이 컴퓨터 작동 능력을 측정하는 OS World와 소프트웨어 엔지니어링 능력을 측정하는 SWE-Bench를 포함하여 여러 벤치마크 기록을 깼다고 말했습니다. 더욱 인상적인 것은 Sonnet 4.6이 "인간과 유사한 지능" 기능을 평가하는 ARC-AGI-2 테스트에서 60.4%의 점수를 획득했다는 것입니다. 이 점수는 Sonnet 4.6이 동급 대부분의 모델보다 우수하지만 전체 성능에서 Opus 4.6, Gemini 3 Deep Think 및 미세 조정된 GPT 5.2와 같은 고급 모델보다 여전히 뒤떨어져 있습니다.

제품 전략 측면에서 앤트로픽은 중저가 가격대의 소네트 시리즈를 지속적으로 강화해 일반 AI 오피스, 소프트웨어 개발, 장문 처리 등 분야에서 경쟁력을 강화하려 하고 있다. 두 배로 늘어난 컨텍스트 창과 향상된 추론 기능을 갖춘 Sonnet 4.6은 대규모 코드 저장소와 복잡한 비즈니스 문서를 처리해야 하는 기업 및 개발자 사용자에게 더욱 매력적일 것으로 예상됩니다.