OpenAI, DALL-E 인공지능 비전 세 번째 버전 출시 model

OpenAI는 생성 인공 지능 시각 예술 플랫폼 DALL-E의 세 번째 버전을 출시했습니다. 이 버전에서는 이제 사용자가 ChatGPT를 사용하여 프롬프트를 생성할 수 있고 더 많은 보안 옵션이 포함됩니다. DALL-E는 텍스트 프롬프트를 이미지로 변환합니다. 그러나 DALL-E2조차도 실수를 하며 종종 특정 문구를 간과합니다. OpenAI 연구원들은 최신 버전이 상황을 더 잘 이해한다고 말합니다.

DALL-E3의 새로운 기능은 ChatGPT와의 통합입니다. ChatGPT를 사용하면 사용자는 DALL-E3를 안내하기 위해 자세한 프롬프트를 직접 작성할 필요가 없습니다. 그들은 단순히 ChatGPT에 프롬프트를 표시하도록 요청하고 챗봇은 DALL-E3가 따라야 할 단락(DALL-E가 더 긴 문장을 사용하는 데 더 좋습니다)을 작성합니다. DALL-E에 대한 특별한 아이디어가 있는 다른 사용자도 자신의 팁을 사용할 수 있습니다.

DALL-E는 StabilityAI 및 Midjourney의 다른 텍스트-이미지 생성 AI 아트 플랫폼보다 앞서 2021년 1월에 처음 출시되었습니다. 2022년 DALL-E2가 출시될 때까지 OpenAI는 DALL-E가 사실적으로 노골적인 이미지를 생성하고 생성된 사진에서 편견을 나타낼 수 있다는 비판 속에서 플랫폼을 사용할 수 있는 사람을 제어하기 위해 대기자 명단을 열었습니다. 지난 9월 회사는 대기자 명단을 없애고 DALL-E2를 대중에게 공개했습니다.

DALL-E의 새 버전은 10월에 ChatGPTPlus 및 ChatGPTEnterprise 사용자에게 먼저 출시되고, 가을에는 연구소와 API 서비스가 출시될 예정입니다. OpenAI는 DALL-E3의 출시를 시차적으로 계획하고 있지만 무료 공개 버전이 언제 출시될지는 확정하지 않았습니다.

OpenAI는 외설적이거나 잠재적으로 혐오스러운 이미지 생성을 방지하기 위한 강력한 보안 조치를 만드는 데 중점을 두고 DALL-E3에 대한 광범위한 작업을 수행했다고 주장합니다. OpenAI는 보안을 테스트하기 위해 시스템을 의도적으로 손상시키려는 그룹인 외부 레드티머와 협력하고 입력 분류기를 사용한다고 말합니다. 이 방법은 언어 모델이 명시적이거나 무차별 프롬프트를 피하기 위해 특정 단어를 무시하도록 가르치는 방법입니다. 또한 DALL-E3는 프롬프트에 이름이 명시적으로 언급되어 있는 경우 공인의 이미지를 재현할 수 없습니다.

회사의 정책 연구원인 산디니 아가르왈(Sandhini Agarwal)은 회사의 보안 조치에 대해 "매우 확신한다"고 말했지만 모델은 지속적으로 개선되고 있으며 완벽하지는 않다고 밝혔습니다. OpenAI 관계자는 이메일을 통해 DALL-E3가 살아있는 예술가 스타일의 이미지를 생성하지 않도록 훈련되었다고 밝혔습니다. DALL-E2와 달리 DALL-E2는 메시지가 표시되면 특정 아티스트의 아트 스타일을 모방할 수 있습니다.

잠재적인 소송을 피하기 위해 OpenAI는 아티스트가 텍스트-이미지 AI 모델의 향후 버전에서 자신의 작품을 제외하도록 선택할 수도 있습니다. 제작자는 자신이 저작권을 소유한 이미지를 제출하고 사이트의 양식을 작성하여 삭제를 요청할 수 있습니다. 이러한 방식으로 DALL-E의 향후 버전에서는 아티스트의 이미지 및 스타일과 유사한 결과를 차단할 수 있습니다. 아티스트들은 DALL-E의 경쟁사인 StabilityAI와 Midjourney, 아트 웹사이트 DeviantArt를 고소하면서 자신들의 저작권 작품을 사용하여 텍스트 이미지 모델을 훈련시켰다고 비난했습니다.