Claude 1M 컨텍스트 창이 완전히 개방되고 가격이 통일되며 미디어 할당량이 크게 증가합니다

Anthropic은 자사의 주력 모델인 Claude Opus 4.6 및 Sonnet 4.6에 대한 100만 개의 토큰 컨텍스트 창이 공식적으로 완전히 공개되었으며 추가 장기 컨텍스트 프리미엄 없이 Claude 플랫폼의 표준 가격으로 청구된다고 발표했습니다.새로운 가격 시스템에서 Opus 4.6은 백만 토큰당 5달러의 입력과 25달러의 출력을 유지하는 반면, Sonnet 4.6은 백만 토큰당 3달러의 입력과 15달러의 출력을 유지합니다. 900,000개 토큰을 요청하더라도 단위 토큰 수수료는 9,000개 토큰을 요청한 것과 정확히 같습니다.

이번 포괄적인 오픈을 통해 Anthropic은 장기적인 컨텍스트 기능과 사용자 경험을 체계적으로 업그레이드했습니다. 우선, 1M 창을 지원하는 모든 요청에는 일반 요청과 동일한 속도 제한이 적용됩니다. 개발자는 높은 동시성 또는 긴 대화 시나리오에서 추가 트래픽 분할 또는 다운그레이드 전략을 구현할 필요가 없습니다. 둘째, 공식은 이전에 200,000개가 넘는 토큰이 있는 컨텍스트에 액세스할 때 필요했던 베타 태그 헤더를 취소했습니다. 이제 200,000개 이상의 토큰이 포함된 요청을 직접 호출할 수 있습니다. 아직 베타 헤더를 보내는 기존 애플리케이션은 코드를 변경하지 않고도 원활하게 전환할 수 있습니다.

미디어 처리 기능도 이번 업그레이드의 핵심 사항 중 하나입니다. Claude가 단일 요청으로 수신할 수 있는 이미지 또는 PDF 페이지 수는 코드 검토, 법률 문서, 과학 연구 논문, 운영 및 유지 관리 로그 등과 같은 복잡한 다중 모드 시나리오를 포함하여 100개에서 600개로 늘어났으며 Claude 플랫폼, Microsoft Azure Foundry, Google Cloud Vertex AI 및 기타 채널에서 동시에 출시되었습니다. Anthropic은 이러한 조정을 통해 개발자가 빈번한 분할 및 압축 없이 수백 페이지의 자료를 한 번에 상황에 맞게 이해할 수 있도록 함으로써 엔지니어링 복잡성과 정보 손실을 줄일 수 있다고 말했습니다.

기업 및 전문적인 시나리오에서 1M 컨텍스트의 영향은 특히 두드러집니다. 관계자들은 긴 맥락이 "잘 기억되고 사용될" 수 있는 경우에만 의미가 있다고 강조합니다. 따라서 Opus 4.6 및 Sonnet 4.6에서는 장거리 기억 및 추론 기능을 위해 특별한 최적화가 이루어졌습니다. 타사 벤치마크에서 Opus 4.6은 MRCR v2에서 78.3%의 점수를 달성했으며 Sonnet 4.6은 GraphWalks BFS(1M 토큰)에서 68.4%의 점수를 획득하여 동일한 컨텍스트 길이의 최첨단 모델 중에서 선두를 달리고 있습니다.

이는 개발자가 복잡한 "창 슬라이딩", "다중 요약 라운드" 또는 기록 컨텍스트를 자주 정리할 필요 없이 전체 코드 저장소, 수만 페이지의 계약 텍스트 또는 도구 호출 추적, 관찰 기록 및 장기 실행 에이전트의 중간 추론 프로세스를 단일 세션에 로드할 수 있음을 의미합니다. 여러 파트너는 1M 컨텍스트를 통해 에이전트가 세부 정보 손실 없이 몇 시간 동안 실행할 수 있으므로 압축으로 인한 주요 정보의 손실을 줄일 뿐만 아니라 여러 차례의 디버깅, 코드 검토, 대규모 운영 및 유지 관리 분석에서 반복되는 보완 및 설명 비용을 줄일 수 있다고 인용문에서 지적했습니다.

코드 개발 분야에서 Opus 4.6의 1M 창은 Claude Code 제품 라인에 완전히 통합되었으며 추가 구성 없이 기본적으로 Max, Team 및 Enterprise 사용자에게 공개됩니다. 개발자들은 컨텍스트를 200,000개에서 500,000개 또는 심지어 1백만 개의 토큰으로 확장한 후 에이전트가 대규모 코드 변경 및 파일 간 종속성을 처리할 때 총 토큰 소비를 줄여 작업을 완료할 수 있었고 컨텍스트 분할로 인해 발생하는 추가 라운드와 반복 요청을 줄일 수 있었다고 보고했습니다.

운영 및 보안 팀도 장기 컨텍스트 기능의 직접적인 수혜자로 간주됩니다. 대규모 생산 시스템과 복잡한 경보 이벤트에 직면한 엔지니어는 한 세션에서 모든 개체, 신호 및 문제 해결 가설을 유지하여 초기 경보부터 문제 완화까지 완전한 정보 링크를 유지할 수 있습니다. 파트너들은 1M 컨텍스트를 사용하면 대규모 로그를 처리하고 데이터를 모니터링하며 다중 소스 시스템 상태를 모니터링할 때 더 이상 자주 "메모리를 압축"할 필요가 없어 미묘한 이상 현상이 누락될 위험이 크게 줄어든다고 말합니다.

법률 회사, 과학 연구 기관 및 데이터 집약적 기업의 경우 긴 컨텍스트 창은 새로운 지식 처리 패러다임을 제공합니다. 법무 담당자는 수백 페이지에 달하는 계약서의 여러 버전을 한 번에 도입하여 여러 라운드의 협상에서 변경 사항을 완전히 검토할 수 있습니다. 과학 연구팀은 수백 개의 논문, 수학 공식 및 시뮬레이션 코드를 하나의 추론 프로세스에 동시에 통합하여 문서와 모델에 대한 포괄적인 분석을 구축할 수 있습니다. 일부 협력 기관에서는 이러한 "단일 통합" 기능이 기초 및 응용 연구의 반복 속도를 크게 가속화하고 있다고 말합니다.

액세스 채널 측면에서 Claude의 기본 플랫폼에서 1M 컨텍스트가 활성화되고 Amazon Bedrock, Google Cloud Vertex AI 및 Microsoft Foundry와 같은 클라우드 서비스를 통해 제공되며 기업과 개발자에게 동시에 열려 있습니다. Anthropic은 팀의 통합 비용 및 배포 전략 평가를 용이하게 하기 위해 해당 기술 문서 및 가격 책정 페이지를 제공하고 1M 창을 지원하는 모든 현재 요청은 기존 청구 표준을 계속 사용할 것임을 강조합니다.

Anthropic은 1M 컨텍스트가 완전히 사용 가능한 단계에 진입함에 따라 사용자가 "입력 길이를 중심으로 엔지니어링 절충안 만들기"에서 "비즈니스 문제 자체를 중심으로 에이전트 설계"로 전환할 수 있도록 돕기 위해 팀이 장거리 추론 안정성, 교차 모달 이해 및 엔터프라이즈 수준 통합 기능을 계속 반복할 것이라고 말했습니다. 개발자와 기업 사용자는 Claude 플랫폼과 주요 클라우드 파트너를 통해 이 기능을 즉시 활성화하여 기존 애플리케이션을 장기 컨텍스트 시대로 원활하게 업그레이드할 수 있습니다.