OpenAI는 오늘 새로운 이미지 생성 모델 gpt-image-1.5를 공식 출시했습니다. 이는 AI 이미지 생성 분야의 경쟁력을 강화하기 위해 Google Gemini 시스템에서 많은 기대를 모았던 Nano Banana 시리즈를 분명히 목표로 삼았습니다. 이 새로운 모델은 개발자와 일반 사용자 모두에게 공개되며 ChatGPT의 이미지 생성 기능을 완전히 대신합니다.

50ce1515-d4b2-47c1-8a11-51edb6fb012a.png

올해 3월 OpenAI는 ChatGPT의 이미지 생성 기능을 대폭 업그레이드했습니다. 새로운 모델은 출시되자마자 빠르게 인기를 끌었습니다. 일주일 만에 사용자는 ChatGPT에서 7억 개 이상의 이미지를 생성했습니다. 그런 다음 4월 OpenAI는 gpt-image-1 인터페이스를 출시하여 개발자에게 동세대 이미지 기술을 공개하여 다양한 애플리케이션과 서비스에 이미지 생성 기능을 통합할 수 있게 했습니다.

하지만 지난 9월 출시된 구글 제미니 나노바나나(Gemini Nano Banana) 모델은 빠르게 화제와 시장을 장악했다. 더욱 강력해진 이미지 생성 및 편집 성능으로 Gemini의 사용자 범위가 크게 늘어났습니다. Nano Banana는 화질과 편집 유연성 측면에서 gpt-image-1보다 종합적으로 앞서 있다고 평가되며 전 세계 개발자들이 널리 채택하고 있습니다. 지난 달 Google은 이를 기반으로 Gemini 3 Pro 이미지(코드명 Nano Banana Pro)를 출시했습니다. Gemini의 추론 능력과 실제 지식의 장점을 활용하여 생성된 이미지의 정확성과 일관성을 더욱 향상시켰습니다.

이러한 배경에서 출시된 gpt-image-1.5는 OpenAI에서 Gemini Nano Banana 시리즈와 직접적으로 경쟁하는 차세대 핵심 제품으로 간주됩니다. 새로운 모델은 이미지 편집의 정교함과 브랜드 로고, 페이스 등 핵심 요소의 충실도를 대폭 향상시켰다. 또한 사용자 지시사항을 이해하고 실행하는 데 있어 더 정확합니다. OpenAI는 또한 새로운 모델이 이미지 내 텍스트 처리, 특히 조밀한 텍스트와 작은 글꼴 크기 텍스트의 명확성과 정확성을 크게 향상시켰다고 강조했습니다.

개발자에게 비용 최적화는 gpt-image-1.5의 하이라이트입니다. 이전 세대 gpt-image-1에 비해 새 모델은 이미지 입력 ​​및 출력 비용이 약 20% 저렴합니다. 개발자는 품질 매개변수를 통해 발전 비용을 세밀하게 제어할 수 있으며, OpenAI는 새 모델이 낮은 품질 설정에서도 여전히 강력한 발전 효과를 유지할 수 있다고 주장합니다.

일반 사용자의 경우 gpt-image-1.5는 ChatGPT에 내장된 이미지 생성 경험의 기본 엔진이 되었습니다. OpenAI는 이 모델이 조명, 구도, 캐릭터 특성 등 세부 사항을 기본적으로 유지하면서 정밀한 편집을 수행할 수 있다고 밝혔습니다. 이전 세대에 비해 최대 4배의 성능 향상을 달성할 수 있으며, 생성 및 편집 응답 속도도 빨라졌다.

OpenAI는 새 모델과 함께 ChatGPT에 새로운 "이미지" 이미지 영역도 출시했는데, 이는 모바일 애플리케이션과 웹 버전에서 동시에 열렸습니다. 사용자는 사전 설정된 필터와 프롬프트 단어를 사용하여 이 영역에서 이미지 생성을 빠르게 시작할 수 있습니다. 이러한 사전 설정은 최신 크리에이티브 스타일과 트렌드를 따르기 위해 정기적으로 업데이트됩니다. OpenAI는 새로운 이미지 생성 모델과 ChatGPT 이미지 경험이 점차 모든 ChatGPT 사용자에게 제공될 것이며 앞으로도 사용 편의성과 생성 효율성을 계속해서 반복할 것이라고 밝혔습니다.