OpenAI, 더 저렴하고 느린 AI를 위한 Flex 처리 API 출시 task

OpenAI는 Google과 같은 경쟁 AI 회사와 더욱 공격적으로 경쟁하기 위해 AI 모델 사용에 대해 저렴한 가격을 제공하지만 응답 시간이 느리고 "가끔 리소스를 사용할 수 없는 경우"를 제공하는 API 옵션인 Flex Process를 도입했습니다.

플랫폼-opengraph.png

Flex 처리는 OpenAI가 최근 출시한 o3 및 o4-mini 추론 모델의 베타 버전으로, 모델 평가, 데이터 강화, 비동기 워크로드 등 우선순위가 낮은 "비프로덕션" 작업을 처리하도록 설계되었다고 OpenAI는 말했습니다.

API 비용을 절반으로 절감합니다. o3의 경우 Flex 처리 가격은 백만 입력 토큰당 10달러(최대 750,000단어) 및 출력 토큰 백만 달러당 20달러입니다. 이에 비해 표준 가격은 입력 토큰 백만 달러당 10달러, 출력 토큰 백만 달러당 40달러입니다. o4-mini의 경우 Flex는 백만 입력 단어당 1.10달러 및 백만 출력 단어당 $4.40에서 백만 입력 단어당 $0.55 및 백만 출력 단어당 $2.20로 가격을 인하했습니다.

Flex 프로세서의 도입은 최첨단 인공 지능의 가격이 계속 상승하고 경쟁업체가 더 저렴하고 효율적이며 예산 지향적인 모델을 출시함에 따라 이루어졌습니다. 목요일에 Google은 Gemini 2.5 Flash를 출시했습니다. 이 추론 모델의 성능은 DeepSeek R1과 동일하거나 그보다 더 우수하며 입력 단어 비용이 더 낮습니다.

OpenAI는 고객에게 Flex 가격을 알리는 이메일을 통해 사용 계층 레벨 1~3의 개발자가 o3에 액세스하려면 새로 도입된 인증 프로세스를 완료해야 한다고 언급했습니다. (레벨은 OpenAI 서비스에 지출된 금액에 따라 결정됩니다.) O3의 추론 다이제스트 및 스트리밍 API 지원에도 인증이 필요합니다.

OpenAI는 이전에 인증이 악의적인 행위자가 사용 정책을 위반하는 것을 막기 위한 것이라고 밝혔습니다.

자세히 알아보기:

https://platform.openai.com/docs/guides/flex-processing