OpenAI는 최신 텍스트-이미지 생성기를 더욱 광범위하게 출시하고 있습니다. 목요일에 회사는 ChatGPTPlus 및 기업 고객이 ChatGPT 애플리케이션에서 사용할 수 있는 새로운 DALL-E3 모델을 제공할 예정입니다. OpenAI는 해당 모델에 대한 보안 완화 스택을 준비하여 출시를 확장할 수 있다고 말했습니다.
DALL-E3는 지난 달 처음 출시되었으며 OpenAI는 사용자가 ChatGPT를 활용하여 이미지 생성기에서 사용할 수 있도록 더 길고 시각적으로 설명적인 프롬프트를 작성할 수 있도록 함으로써 이전 DALL-E2에서 어떻게 개선되었는지 보여주었습니다. DALL-E3는 Bing Chat 및 Bing Image Generator에 추가되어 Microsoft 플랫폼이 ChatGPT 이전에도 대중에게 더 광범위한 모델 액세스를 제공하는 최초의 플랫폼이 되었습니다.
유해한 이미지를 줄이기 위해 광고된 안전 장치가 항상 작동하는 것은 아니었습니다. 사용자가 스폰지밥 네모바지와 건물을 향해 비행기를 날아가는 기타 캐릭터를 보여주는 세계 무역 센터의 이미지를 생성했기 때문입니다. Microsoft가 특정 프롬프트를 차단하려고 시도했지만 다른 간단한 해결 방법으로도 비슷한 결과가 나타났습니다.
Midjourney, StableDiffusion 및 이전 버전의 DALL-E와 같은 텍스트-이미지 생성기는 모두 논란을 불러일으켰습니다. 이 기술은 저작권이 있는 이미지 자료, 합의되지 않은 과도한 노출, 인종을 바꾸는 주제, 공인에 대한 사실적인 허위 표현을 내보냈습니다.
OpenAI는 이번에 더 광범위한 접근 방식을 약속하며 DALL-E3에 대한 연구를 보여주는 웹 사이트를 제공했습니다. 회사는 "모델이 살아있는 예술가가 스타일링한 콘텐츠와 공인의 이미지를 생성할 가능성을 제한하고 생성된 이미지의 인구통계학적 표현을 향상시킬 것"이라고 밝혔습니다. OpenAI에는 또한 내부 "출처 분류기" 도구가 있는데, 이 도구는 이미지가 DALL-E3에 의해 생성되었는지 여부를 감지하는 데 99% 정확하다고 말합니다.