몇 주 전 OpenAI는 첫 번째 개발자 이벤트에서 생성 인공 지능 서비스를 위한 최신 대규모 언어 모델인 GPT-4Turbo를 출시했습니다. 이후 Microsoft는 Azure OpenAI 서비스에 GPT-4Turbo 모델을 추가하겠다고 발표했습니다. 오늘 Microsoft는 Azure OpenAI 서비스의 향상된 기능을 발표했습니다. 이제 Vision 모델이 포함된 GPT-4 Turbo가 고객에게 공개 미리 보기로 제공됩니다.

Microsoft는 블로그 게시물에서 다음과 같이 말했습니다.

이 고급 다중 모드 AI 모델은 GPT-4Turbo의 모든 강력한 기능을 유지하는 동시에 이미지 입력을 처리하고 분석하는 기능을 도입합니다. 이를 통해 접근성 개선, 시각적 데이터 해석 및 분석, 시각적 질문 답변(VQA)을 비롯한 광범위한 작업에 GPT-4를 활용할 수 있는 기회가 열립니다.

또한 Microsoft는 Vision이 포함된 GPT-4 Turbo의 미리 보기 버전을 통해 Azure OpenAI 고객을 위한 더 많은 기능을 추가했습니다. 그 중 하나는 이미지를 검사하고 이미지에 있는 텍스트를 추출하여 사용자 프롬프트에 통합할 수 있는 광학 문자 인식(OCR)입니다.

GPT-4 TurbowithVision의 또 다른 기능은 객체 접지입니다. 이를 통해 AI는 사용자의 텍스트 프롬프트를 기반으로 이미지를 검사하고 이미지에 주요 객체를 표시할 수 있습니다. 마찬가지로 AI는 비디오의 특정 프레임을 분석할 수도 있습니다.

마이크로소프트는 다음과 같이 덧붙였습니다.

GPT-4 Turbo를 Vision, Azure AI Search 및 Azure AI Vision과 결합하면 이제 이미지와 텍스트 데이터를 함께 추가하여 벡터 검색을 통해 사용자 데이터에 연결하여 챗봇 경험을 향상시키는 솔루션을 개발할 수 있습니다.

이 서비스의 가격은 입력 1,000단어당 0.01달러, 출력 1,000단어당 0.03달러이며 향상된 기능에 대한 가격은 다양합니다.

현재 GPT-4Turbo with Vision은 AzureOpenAI의 호주 동부, 스웨덴 중부, 스위스 북부 및 미국 서부 지역에서 사용할 수 있습니다. 비전 기능을 갖춘 GPT-4Turbo의 공개 미리보기에 액세스하는 고객은 "향후 몇 주 안에 안정적이고 생산 가능한 버전"으로 자동 업데이트됩니다.