OpenAI는 Google과 같은 경쟁 AI 회사와 더욱 공격적으로 경쟁하기 위해 AI 모델 사용에 대해 저렴한 가격을 제공하지만 응답 시간이 느리고 "가끔 리소스를 사용할 수 없는 경우"를 제공하는 API 옵션인 Flex Process를 도입했습니다.

Flex 처리는 OpenAI가 최근 출시한 o3 및 o4-mini 추론 모델의 베타 버전으로, 모델 평가, 데이터 강화, 비동기 워크로드 등 우선순위가 낮은 "비프로덕션" 작업을 처리하도록 설계되었다고 OpenAI는 말했습니다.
API 비용을 절반으로 절감합니다. o3의 경우 Flex 처리 가격은 백만 입력 토큰당 10달러(최대 750,000단어) 및 출력 토큰 백만 달러당 20달러입니다. 이에 비해 표준 가격은 입력 토큰 백만 달러당 10달러, 출력 토큰 백만 달러당 40달러입니다. o4-mini의 경우 Flex는 백만 입력 단어당 1.10달러 및 백만 출력 단어당 $4.40에서 백만 입력 단어당 $0.55 및 백만 출력 단어당 $2.20로 가격을 인하했습니다.
Flex 프로세서의 도입은 최첨단 인공 지능의 가격이 계속 상승하고 경쟁업체가 더 저렴하고 효율적이며 예산 지향적인 모델을 출시함에 따라 이루어졌습니다. 목요일에 Google은 Gemini 2.5 Flash를 출시했습니다. 이 추론 모델의 성능은 DeepSeek R1과 동일하거나 그보다 더 우수하며 입력 단어 비용이 더 낮습니다.
OpenAI는 고객에게 Flex 가격을 알리는 이메일을 통해 사용 계층 레벨 1~3의 개발자가 o3에 액세스하려면 새로 도입된 인증 프로세스를 완료해야 한다고 언급했습니다. (레벨은 OpenAI 서비스에 지출된 금액에 따라 결정됩니다.) O3의 추론 다이제스트 및 스트리밍 API 지원에도 인증이 필요합니다.
OpenAI는 이전에 인증이 악의적인 행위자가 사용 정책을 위반하는 것을 막기 위한 것이라고 밝혔습니다.
자세히 알아보기:
https://platform.openai.com/docs/guides/flex-processing