OpenAI가 어제 조용히 중요한 소식을 발표했습니다. 주력 최첨단 모델 GPT-4o는 이제 더 많은 출력 토큰을 지원합니다. GPT-4oLongOutput이라고 하는 GPT-4o의 실험 버전은 이제 요청당 최대 64,000개의 출력 토큰을 지원합니다.
이는 개발자가 완료하는 데 시간이 더 오래 걸리는 사용 사례에 GPT-4o 모델을 사용하는 데 도움이 됩니다. OpenAIalpha 프로그램에 참여하는 개발자는 "gpt-4o-64k-output-alpha" 모델 이름을 사용하여 GPT-4oLongOutput에 액세스할 수 있습니다.
OpenAI는 장기 완료 비용이 높기 때문에 이 모델의 토큰당 가격을 인상했습니다. gpt-4o-64k-output-alpha의 가격은 $6.00/100만 입력 토큰 및 $18.00/100만 출력 토큰입니다.
이와 관련하여 Microsoft는 어제 전 세계 및 미국 동부 표준 배포에 대한 시각적 지원을 제공하기 위해 GPT-4ominiAPI의 출시를 발표했으며 Microsoft는 곧 이를 더 많은 지역으로 홍보할 예정입니다.
GPT-4omini의 시각적 지원을 통해 개발자는 API를 사용하여 시각적 인식, 장면 이해 등과 관련된 응용 프로그램에서 이미지와 비디오를 처리할 수 있습니다. 또한 GPT-4omini는 시각적 입력을 기반으로 상세하고 상황에 맞게 정확한 텍스트 출력을 생성할 수 있습니다.
Microsoft Azure 팀은 Azure에서 GPT-4omini의 가용성에 대해 다음을 작성했습니다.
"GPT-4omini는 시각적 입력 기능을 추가하여 다양성을 확장하고 개발자와 기업을 위한 새로운 지평을 열었습니다. 이 향상된 기능을 통해 사용자는 시각적 데이터를 처리 및 분석하고 귀중한 통찰력을 추출하며 포괄적인 텍스트 출력을 생성할 수 있습니다."
Azure 고객은 이제 AzureOpenAIStudioPlayground에서 GPT-4omini를 사용해 볼 수 있으며, 여기에서 모델에 대해 자세히 알아볼 수 있습니다.
OpenAI 및 Microsoft 제품의 이러한 발전은 인공 지능 분야, 특히 언어 및 비전 모델의 급속한 발전을 보여줍니다. 이러한 모델이 더욱 강력해지고 사용하기 쉬워짐에 따라 개발자와 기업은 소비자에게 제공하는 경험을 다시 생각해 볼 수 있는 새로운 가능성을 열어줍니다.