프롬프트가 더 이상 존재하지 않습니까? DALL·E3는 갑자기 정확한 도면과 사실적인 디테일을 갖춘 ChatGPT로 통합되었습니다. OpenAI는 오늘 AI 페인팅계를 정말로 폭발시켰습니다. 아침에 일어나보니 AI 그림판이 빵빵해 져 있었습니다. OpenAI가 블록버스터를 떨어뜨렸습니다. ChatGPT와 합병된 DALL·E3가 공식 발표되었습니다!
하나는 역사상 가장 강력한 언어 모델이고, 다른 하나는 역사상 가장 강력한 Vincentian 그래프 모델입니다. 이 둘의 조합은 AIGC 서클 전체를 전복시킬 수밖에 없습니다.
가장 강력한 변환을 거친 후 DALL·E3는 의미의 뉘앙스를 이해할 수 있으며 세부 사항은 놀라울 정도로 현실적입니다.
프롬프트: "중앙에 분화구 크기의 구멍이 있고 '안이 그냥 비어 있는 것 같아'라고 말하는 치료사의 의자에 앉아 있는 아보카도의 그림. 치료사, 숟가락, 휘갈겨 쓰는 메모"
네티즌들은 "DALL·E3가 이미지 속 텍스트를 정말 정확하게 표현할 수 있다면 게임의 규칙이 완전히 바뀔 것이다!!!"라고 외쳤다.
동시에 프롬프트에 대한 임계값도 크게 감소되었습니다.
"조기 사망"한 사용자는 더 이상 멋진 프롬프트 단어를 작성하지 못할까 봐 걱정할 필요가 없습니다. 힌트만 주시면 ChatGPT가 설득력 있는 문단을 작성해 드립니다.
즉, 상상력을 마음껏 발휘하고 ChatGPT를 사용하여 날아갈 수 있습니다!
더 이상 메시지를 표시하는 방법을 알아내느라 머리를 쥐어뜯을 필요가 없습니다! ChatGPT와 대화하는 것만으로도 멋진 글을 쓸 수 있습니다
대화 중에 생성된 이미지를 기반으로 언제든지 변경할 수도 있습니다.
Google의 멀티모달 Gemini 출시를 따라잡기 위해 OpenAI가 앞장섰음을 알 수 있습니다.
Nvidia의 수석 AI 과학자인 Jim Fan은 이것이 대규모 멀티모달 LLM과 Google Gemini 사이의 장대한 전투를 미리 보여주는 것이라고 흥분되게 말했습니다!
OpenAI CEO인 Sam Altman도 댓글 영역에서 "Wearesoback"이라고 자랑스럽게 말했습니다.
현재 DALL·E3는 아직 내부 테스트 중이며 10월 초 모든 플러스 사용자와 기업 사용자를 대상으로 출시될 예정이다.
Midjourney의 라이벌이 실제로 나타났습니다!
DALL·E3는 기본적으로 ChatGPT를 기반으로 구축된다는 점에서 독특합니다.
ChatGPT에 간단한 문장이나 자세한 단락을 요청하면 브레인스토밍과 팁 개선이 시작됩니다.
Nvidia의 최고 과학자 Jim Fan은 이것이 너무 충격적이라고 말했습니다!
DALL·E3의 의의는 Midjourney의 강력한 상대일 뿐만 아니라,이는 멀티모달 대형모델 전쟁이 곧 발발할 것임을 의미하기도 한다.
DALL·E3의 탁월한 언어 일치 기능은 견고한 텍스트 GPT 기반을 기반으로 합니다. Midjourney에는 실제로 "추론 두뇌"가 많지 않기 때문에 많은 힌트 해킹이 필요합니다.
두뇌가 먼저, 픽셀이 나중에 강력한 다중 모드 AI를 구축하는 방법입니다.
프롬프트 엔지니어링을 배울 필요도 없고, 하고 싶은 대로 하면 됩니다. 신속한 단어를 위해 ChatGPT가 작성을 도와줄 것이며, 절묘한 그림의 세부 사항은 DALL·E3에서 처리해 드릴 것입니다.
다음 예에서는 DALL·E3가 다음 그림을 생성할 때 텍스트의 모든 장면을 그림에 꼼꼼하게 새겼는지 보여주며 화질은 영화와 같습니다.
보름달 아래 거리에는 밤의 유흥을 즐기는 사람들로 붐볐습니다.
모퉁이 노점에서는 불타는 듯한 붉은 머리에 우아한 벨벳 망토를 입은 소녀가 심술궂은 상사와 흥정을 하고 있었습니다.
키가 크고 건장한 사장은 깔끔한 양복과 눈에 띄는 턱수염을 기르고 복고풍 스팀펑크 스타일의 전화기로 활기차게 이야기를 나누고 있었습니다.
또한 동일한 프롬프트에서 DALL·E3으로 그린 이미지는 DALL·E2보다 더 정확합니다.
예를 들어, "아산의 아산 폭발을 묘사한 덩크슛을 표현하는 농구 선수의 유화"와 같이 DALL·E3는 캐릭터, 농구공 및 더 많은 매크로 배경 생성에 있어 더욱 세밀합니다.
네티즌들이 만든 비교차트에서 알 수 있듯이 DALL·E3와 DALL·E2의 격차는 엄청나다고 할 수 있다.
네티즌들은 OpenAI가 이번에는 단지 Midjourney를 뛰어넘으려는 것이 아니라고 말했습니다. Google은 가장 큰 경쟁자이며, 특히 최근에는 Gemini가 임박했습니다.
어떤 사람들은 이러한 변화가 AI 페인팅 도구의 중요한 진화 추세를 반영한다고 말합니다.사람을 이해하다.
AI가 이미지를 더 잘 설명하고 수정할 수 있게 해준다면 정말 좋을 것 같아요! DALL·E3가 어디까지 갈 수 있는지 기다려 보겠습니다.
DALL·E3+채팅GPT
DALL·E3+ChatGPT, 얼마나 놀라운가요?
Altman은 DALL·E3가 생성한 귀여운 디테일을 홍보 영상에 숨겼습니다.
DALL·E3는 5세 어린이의 환상을 현실로 바꿔줄 수 있습니다.
"우리 5살 아기가 '슈퍼 해바라기 고슴도치'에 대해 이야기하고 있어요. 어떻게 생겼을까요?"
ChatGPT는 4가지 프롬프트 단어를 기반으로 다양한 스타일의 이미지를 자동으로 생성합니다. 여기에서 마지막 사진을 선택하면 계속해서 생성할 수 있는 기본 그림을 설정할 수 있습니다.
다음으로 작은 고슴도치 이름을 래리(Larry)라고 짓고 집을 그려주세요.
DALL·E3는 요구 사항을 정확하게 이해했을 뿐만 아니라 사서함의 "Larry"를 포함하여 사진 속 텍스트에 주석을 달 수 있음을 알 수 있습니다.
이전 DALL·E 모델이 전혀 쓸 수 없었던 문제를 완전히 해결했습니다.
그리는 동안 스토리라인을 완성할 수도 있고, 그림을 추가할 수도 있습니다.
또한 DALL·E3는 위 스타일을 기반으로 귀여운 스티커를 생성할 수도 있습니다.
마지막으로 ChatGPT가 위의 내용을 요약하고 취침 시간 이야기를 생성하도록 하세요. 이는 정말 완벽합니다.
OpenAI 공식은 또한 수많은 정교한 사진 앨범을 제공합니다.
프롬프트: 고양이를 부드럽게 안고 있는 소녀를 그린 종이 예술 작품입니다. 그들은 둘 다 화분에 앉아 있었고, 고양이는 만족스럽게 가르랑거리고 있었고 소녀는 웃고 있었습니다. 장면에는 수제 종이 꽃과 나뭇잎이 점재되어 있습니다.
그녀를 촉매하는 포옹을 하는 소녀를 묘사한 종이 공예 예술. 둘 다 화분 한가운데에 있고, 소녀가 웃는 동안 고양이는 만족스럽게 가르랑거리고 있습니다. 장면은 손으로 만든 종이꽃과 잎으로 장식되어 있습니다.
DALL·E3는 아름다운 포스터를 만들고 텍스트를 추가할 수 있습니다.
프롬프트: 비너스 복고풍 여행 포스터, 초상화. 해당 이미지에는 짙은 노란색 구름으로 둘러싸인 금성과 다가오는 낡은 로켓선의 실루엣이 담겨 있습니다. 신비한 모양은 구름 아래 산과 계곡을 암시합니다. 하단의 텍스트에는 "금성 탐험: 안개 뒤의 아름다움"이라고 적혀 있습니다. 컬러 구성은 골드, 옐로우, 소프트 오렌지로 구성되어 호기심을 불러일으킵니다.
초상화 방향으로 금성을 위한 빈티지 여행 포스터. 그 장면은 빈티지 로켓이 다가오는 실루엣과 함께 금성의 두껍고 노란 구름을 묘사합니다. 신비한 모양빛 구름 아래 산과 계곡. 하단 텍스트에는 '금성 탐험: 안개 뒤의 아름다움'이라고 적혀 있습니다. 색상 구성표는 금색, 노란색, 부드러운 주황색으로 구성되어 경이로움을 불러일으킵니다.
프롬프트: 이 그림은 폭풍우가 몰아치는 파도 속에서 받침대 위에 서 있는 반투명 유리로 만들어진 인간의 심장을 묘사합니다. 한 줄기 햇빛이 구름을 뚫고 마음을 비추고 그 안의 소우주를 드러낸다. 지평선에는 "당신 안의 우주를 찾으세요."라는 눈길을 끄는 문자가 새겨져 있습니다.
폭풍우가 치는 바다 속에 서 있는 반투명 유리로 만들어진 인간의 마음을 그린 그림입니다. 햇빛이 구름을 뚫고 마음을 비추고 그 안의 작은 우주를 드러냅니다.
프롬프트: 이것은 폭풍우가 치는 날 창턱에 놓인 커피잔의 3D 렌더링입니다. 창 밖의 폭풍우가 커피잔에 반사되어 작은 번개와 부서지는 파도가 보입니다. 내부는 은은한 조명이 드라마틱한 분위기를 더해줍니다.
폭풍우가 치는 날 창문에 놓인 커피 머그잔을 A3로 렌더링합니다. 창밖의 폭풍우가 커피에 반사되고, 머그잔 안에는 소형 번개와 난류가 보입니다. 방의 조명이 어두워 드라마틱한 분위기를 더해줍니다.
프롬프트: 폭풍 속에서 배를 조종하는 늙은 선장의 상세한 유화입니다. 풍화된 얼굴에 바닷물이 튀었고, 그의 눈은 결단력이 있었다. 위에서 소용돌이치는 사악한 구름이 보이고, 거친 파도가 배를 휩쓸려고 위협하고, 갈매기들이 잠수하며 혼란스러운 풍경을 소용돌이치며 지나갑니다. 멀리서 천둥과 빛이 들려오며 으스스한 녹색 빛으로 현장을 비췄다.
폭풍우를 뚫고 배를 조종하는 늙은 바다 선장의 상세한 유화. 바닷물은 이 풍화된 얼굴에 다시 튀고, 그의 결심. 갈매기가 잠수하고 혼란스러운 풍경을 빙빙 돌리는 동안 선미 위로 소용돌이치는 사악한 구름이 배를 잠수할 위험이 있습니다. 천둥과 빛이 거리에서 으르렁거립니다. 어두운 녹색 빛으로 현장을 비춥니다.
미드저널이 너무 약해요
이 소식이 나오자마자 인터넷에는 미드저니와의 비교 사진이 삽시간에 쏟아졌다.
마찬가지로 Midjourney와 DALL·E3는 동일한 수준이 아닙니다.
또한 SDXL과 DALL·E3은 비교 차트를 생성합니다.
일부 네티즌들은 RawMidjourney, Non-rawMidjourney 및 DALL·E3를 사용하여 동일한 프롬프트를 사용하여 사진을 생성했다고 말했습니다.
일부 네티즌들은 Midjourney와 DALL·E3PK의 사진을 더 많이 만들었습니다.
코드명 "Gizmo"라는 새로운 프로토타입
동시에 네티즌 "TiborBlaho"도 OpenAI가 ChatGPT용 코드명 "Gizmo"라는 새로운 프로토타입을 개발하고 있다는 소식을 전했습니다.
업데이트된 UI 인터페이스를 갖추고 있으며 기업 고객을 위한 강력한 "Gizmo Editor"를 도입하여 사용자가 자신만의 "GPT"를 만들 수 있습니다.
특히 GPT에 대해 프로필 사진, 모델(GPT-3.5 또는 GPT-4), 기능(DALL·E, 웹 탐색, 샌드박스 코딩, 플러그인 등 포함), 활성화된 플러그인 목록, 동작(이 GPT의 정의, 기능, 알아야 할 내용), 환영 메시지(사용자가 이 GPT와 새 채팅을 시작할 때 말해야 하는 내용)를 정의하고 이 GPT가 비공개인지 여부를 결정할 수 있습니다.