Anthropic의 Claude Sonnet 4 모델은 이제 최대 1백만 개의 토큰을 지원합니다

인공 지능 스타트업 Anthropic은 자사의 인기 있는 Claude Sonnet 4 LLM 모델이 이제 최대 100만 개의 상황별 토큰을 지원한다고 발표했습니다. Google Gemini에 이어 Anthropic은 1백만 개의 상황별 토큰을 제공하는 두 번째 주요 모델 제공업체가 되었습니다.

이전에 Claude Sonnet 4 API는 200,000개의 상황별 토큰만 지원했습니다. 이 5배 확장을 통해 개발자는 단일 요청으로 75,000줄 이상의 코드로 구성된 전체 코드 기반을 보낼 수 있습니다.

확장된 컨텍스트 지원은 현재 Anthropic API 및 Amazon Bedrock에서 공개 테스트 중이며 Google Cloud Vertex AI는 곧 출시될 예정입니다. 그러나 긴 컨텍스트 지원은 현재 Tier 4 개발자로 제한되며 사용자 지정 속도 제한이 필요합니다. Anthropic은 이 기능이 앞으로 몇 주 안에 더 많은 개발자에게 제공될 것이라고 밝혔습니다.

더 큰 토큰 창에는 더 높은 컴퓨팅 성능이 필요하기 때문에 Anthropic은 특별 가격을 도입했습니다. 200,000개 미만의 토큰에 대한 프롬프트의 경우 Sonnet 4의 비용은 입력 토큰 백만 개당 3달러, 출력 토큰 백만 개당 15달러입니다. 200,000개가 넘는 토큰이 포함된 프롬프트의 경우 비용은 입력 토큰 100만 개당 6달러, 출력 토큰 100만 개당 22.50달러입니다.

개발자는 빠른 캐싱 및 일괄 처리를 사용하여 비용을 절감할 수 있습니다. 예를 들어 일괄 처리는 1M 컨텍스트 창 가격에 대해 50% 할인을 제공할 수 있습니다.

최근 Reddit AMA 세션에서 OpenAI 리더들은 모델에 대한 긴 컨텍스트 창 지원에 대해 논의했습니다. OpenAI CEO인 Sam Altman은 OpenAI가 긴 컨텍스트 길이에 대한 강력한 사용자 수요를 보지 못했지만 충분한 관심이 있다면 기꺼이 지원할 것이라고 말했습니다. 제한된 컴퓨팅 성능으로 인해 그들은 다른 우선순위에 집중하기를 원합니다.

OpenAI 팀의 Michelle Pokrass는 특히 API 사용 사례의 경우 GPT-5에서 최대 100만 개의 토큰까지 더 긴 컨텍스트를 제공하고 싶었지만 높은 GPU 수요로 인해 그렇게 하지 않았다고 썼습니다.

Anthropic의 1M 컨텍스트 지원은 긴 컨텍스트 기능을 놓고 Google Gemini와 직접적인 경쟁을 벌이게 하여 OpenAI가 로드맵을 다시 생각하도록 압력을 가하고 있습니다.