OpenAI의 오랫동안 대대적인 에이전트가 공식 출시되었습니다! 공식 소개:연산자우리의 첫 번째 에이전트 중 하나입니다. 이러한 AI는 독립적으로 작업을 수행할 수 있습니다.작업을 지정하면 실행됩니다.. Belike에 쇼핑 목록을 제공하면 Operator가 완전히 자율적으로 좋은 물건을 구매할 수 있도록 도와드립니다.


오퍼레이터의 손이 키보드에서 떠난 것을 볼 수 있으며 화면상의 모든 작업은 오퍼레이터가 직접 완료합니다.

레스토랑 예약에도 사용할 수 있습니다.


Ultraman의 라이브 방송이 끝나자마자 OpenAI 사장 Brockman은 다음과 같은 소식을 빨리 발표했습니다.

2025년은 지능형 에이전트의 해입니다.


그리고 이번에 Operator는 곧 출시될 것이라고 공식 발표했습니다. 하지만 당분간은 Pro 사용자에게만 제공됩니다. 그렇습니다. 한 달에 미화 200달러(약 1,458위안)가 드는 대규모 멤버십입니다.

생방송을 본 네티즌들은 여전히 ​​'미친 목요일'이라며 열광했다.


하지만...


음, Operator는 매우 인기가 있지만 오픈 소스라면 더욱 좋을 것입니다. DeepSeek과 Meta는 총독이 될 것입니다.

사람의 도움 없이 브라우저로 플레이

증거는 없습니다. 먼저 공식 데모를 통해 Operator가 얼마나 "독립적"인지 살펴보겠습니다.

사람의 도움 없이 거의 모든 웹사이트에서 사용할 수 있습니다.


Allrecipes에서 조개 링귀니 레시피를 찾고 모든 재료를 내 인스타카트 카트에 추가하는 것을 좋아하시나요?


그것이 작동하는 논리는 인간과 동일합니다. 어떤 그림을 보고 어떤 버튼을 클릭해야 하는지 말입니다.

이는 API나 프로그래밍 인터페이스를 사용하는 다른 에이전트와 다릅니다. 추론을 위한 텍스트 기반 사고 체인을 기반으로 합니다.


메뉴를 확인한 후 어느 매장으로 가서 주문하면 되나요?

인간은 Gus의 명령을 사용하여 추가 지침을 제공하고 운영자는 해당 웹 사이트로 이동하여 주문을 시작합니다.


로그인, 결제 및 기타 작업이 발생하면 운영자는 사용자에게 작업 권한을 반환합니다.

실제 사용자 테스트에서 일부 블로거는 Reddit에 의해 Operator가 차단된 경우 검색에 "Reddit" 키워드를 추가하여 관련 게시물을 찾는다는 사실을 발견했습니다.


사용자는 맞춤형 지침을 추가하여 개인화된 경험을 얻을 수도 있습니다. 예를 들어, 항공편 예약 시 선호하는 항공사를 설정하세요.

Operator를 사용하면 사용자가 홈 페이지에 빠르게 액세스할 수 있도록 프롬프트를 저장할 수 있으므로 쇼핑 사이트에서 재고를 보충하는 등 반복적인 작업에 이상적입니다.

운영자는 Etsy에서 맞춤형 에나멜 머그를 주문하고 Hipcamp에서 캠프장을 예약하는 등 여러 웹 페이지를 여는 등 여러 작업을 동시에 실행할 수도 있습니다.


Operator의 하단 레이어는 새로운 모델을 사용합니다.CUA(컴퓨터 사용 에이전트).

CUA는 GPT-4o의 시각적 기능과 고급 추론 강화 학습을 결합하여 GUI 상호 작용을 가능하게 합니다.

운영자는 웹 인터페이스의 내용을 볼 수 있으며 마우스와 키보드에서 허용되는 모든 작업을 사용할 수 있습니다. 이를 통해 맞춤형 API 통합 없이도 자동으로 작동할 수 있습니다.

문제나 오류가 발생하는 경우,운영자는 추론 기능을 사용하여 자체 수정 가능. 문제가 발생하여 도움이 필요할 때 사용자에게 다시 제어권을 넘겨줍니다.

CUA는 WebArena와 WebVoyager 벤치마크 모두에서 SOTA를 달성했습니다.


현재 미국의 Pro 회원은 이미 Operator.chatgpt.com을 통해 Operator를 사용할 수 있습니다. 다른 지역의 Plus, Team, Enterprise 및 뚱뚱한 친구와 같은 유료 사용자는 기다려야 하지만 OpenAI는 향후 이러한 기능을 ChatGPT에 통합할 것을 약속합니다.

OpenAI, '레벨 3' 진입

2024년 7월 OpenAI는 "AI에서 AGI까지 5단계 프로세스"를 발표했습니다.

레벨1: 챗봇, AI는 사람들과 대화식으로 소통할 수 있습니다.

레벨2: Reasoners, AI 기술은 인간 수준의 문제를 해결합니다.

레벨3: 에이전트, AI는 일부 액션 작업을 시스템으로 수행할 수 있습니다.

레벨4: Innovators, AI는 혁신적인 AI를 개발할 수 있습니다.

레벨5: 조직, AI는 조직이 완료한 업무를 완성할 수 있습니다.

OpenAI는 당시 정의와 기획에서 레벨 1 단계에 불과하며 레벨 2에 가까워지고 있다고 밝혔습니다.

그리고 이제 Operator의 출시와 함께 Ultraman은 다음과 같이 발표했습니다.

이것이 레벨 3 진입의 시작입니다.

처음에 언급했듯이 OpenAI가 조용히 중요한 점을 도출했다는 점은 주목할 가치가 있습니다. 즉, Operator는 여전히 "첫 번째 배치” 유일한 지능형 에이전트가 아닙니다.

라이브 방송에서 울트라맨은 다음과 같이 발표했습니다.

또한 앞으로 몇 주, 몇 달 안에 추가 에이전트를 출시할 예정입니다.


하나더많은것

오늘 OpenAI 생방송 직전에 작은 소식이 있습니다.

OpenAI는 Operator 출시 2시간 전에 ChatGPT 및 API의 높은 오류율 문제를 해결했다는 트윗을 보냈습니다.


네티즌들 사이에서 또다시 허위샷(도제)이 발생했다.


또 다른 좋은 소식은 Ultraman이 ChatGPT 무료 버전에서도 o3-mini를 사용할 수 있다고 발표했다는 것입니다.