원래는 삼성 갤럭시 S26 시리즈가 이미 공개됐고, 기자회견은 그냥 지나칠 거라 생각했어요. 의외로 삼성과 구글은 뭔가를 숨기고 있다. 두 회사는 공동으로 S26의 새로운 Gemini 지능형 기능을 시연했습니다. Gemini는 음성 명령을 통해 Uber에서 택시를 부르거나 DoorDash에서 테이크아웃을 주문하는 데 도움을 줄 수 있습니다.


출처: 안드로이드 센트럴

이 기능은 현재 초기 미리 보기 단계이며 미국과 대한민국에서만 사용할 수 있습니다.

Google과 Samsung이 힘을 합쳐 "Doubao Mobile"(정확히 말하면 Doubao Mobile Assistant라고 함)의 글로벌 버전을 만들었다는 것을 이해할 수 있습니다.

Galaxy S26 시리즈는 시작에 불과하며 이러한 기능은 나중에 Google Pixel 10 휴대폰과 더 많은 Android 17 기기에 적용됩니다.

많은 휴대폰/컴퓨터 시스템 수준의 AI 에이전트를 보고 사용해 본 결과, 그리고 '빈백폰'에 대해서도 심도 있게 사용해 본 결과, 이번에 Gemini 에이전트를 살펴보면 이에 대한 논의가 '새로운 기능'에서 끝나서는 안 된다는 생각이 듭니다.

물론 Android 운영 체제의 기본 프레임워크가 스마트폰에 맞게 맞춤화되는 것은 이번이 처음이 아닙니다. OPPO, Honor, Huawei 등을 포함한 많은 제조업체가 이미 몇 차례 초기 시도를 했습니다.

하지만 이 사람은 안드로이드 운영체제의 절대주인 구글이다.

ByteDance가 "외부인"으로서 국가 수준의 앱에 대해 "무례한" 시도를 한다면, Google이 이를 하게 된다면 의미는 완전히 달라질 것입니다.

하지만 걱정하지 말고 이번에는 구글과 삼성이 만든 '빈백폰'에 대해 살펴보자.

삼성 '빈백폰', 어떻게 사용되나?

삼성과 구글이 이번에 시연한 '제미니 자동화 작업(Gemini Automated Task)' 기능은 사람이 휴대폰을 조작하는 모습을 모방해 작업을 자동화할 수 있다. 그 뒤에 있는 구현 아이디어는 AI 화면 읽기 + 시스템 하위 레이어/애플리케이션 레이어 API의 이중 경로입니다.

Byte와 Nubia가 공동 개발한 "Doubao Phone"은 API가 아닌 시스템 수준 권한 및 화면 읽기 기능을 많이 사용한다는 점에 유의해야 합니다. Doubao Mobile의 주요 접근 방식은 "애플리케이션 개발자에게 인사하지 않는 것"이라는 것을 이해할 수 있습니다(적어도 주류 국가 수준의 앱은 그렇지 않습니다). "강제" 구현 아이디어는 또한 국가 수준의 앱이 이를 차단하고 저항할 수 있는 손잡이를 남겨둡니다.

갤럭시S26 시리즈에 삼성과 구글이 이번에 개발한 제미니 스마트폰은 두 가지를 모두 갖고 있다고 할 수 있다. 삼성이 공개한 정보에 따르면, 자사 앱 스토어의 상위 200개 앱은 모두 이를 지원할 수 있습니다(그러나 나중에 자세히 설명하겠지만 특정 앱의 효과만 보장할 수 있습니다). 이는 삼성과 구글이 적어도 일반적으로 이들 앱 개발자들에게 인사를 했다는 것을 의미합니다.


"Wired" 잡지의 경험을 살펴보겠습니다. Gemini에게 직접 전화하여 공항에 간다고 말하세요. Gemini 애플리케이션 자체는 "가상 창"을 열어 Uber를 열고 백그라운드에서 이 작업을 실행하기 시작합니다. 사용자는 언제든지 클릭하여 Gemini의 실행 과정을 볼 수 있습니다.

해당 지역에는 여러 공항이 있으므로 Gemini는 사용자에게 적절한 목적지를 선택하도록 신속하게 알려줍니다. 주문할 때 Gemini는 사용자가 적절한 차량을 선택하고 결제할 수 있도록 인터페이스를 사용자에게 푸시합니다.

Gemini의 '가상창'은 사용자의 개인정보 보호를 위한 구글의 배려인 샌드박스화된 '가상머신'으로 이해될 수 있습니다.

예전에는 Gemini가 안드로이드 시스템에서 구동됐지만, 이번에 새로운 Gemini 에이전트가 애플리케이션을 구동할 때는 이 샌드박스 내에서만 작동하고 기기의 다른 부분에는 건드리지 않는다.

한 가지 더 언급하자면, 클라우드 컴퓨터/클라우드 전화 기능을 갖춘 지능형 제품인 Manus, Kimi 컴퓨터, AutoGLM 등을 사용해 본 적이 있다면 이 Gemini 가상 머신의 논리를 쉽게 이해할 수 있을 것입니다.


이미지 출처: 9To5Google

이는 상당히 간단한 작업으로, 국내의 많은 AI 모바일 비서들은 이미 1년 전에 이 시나리오를 극복했습니다.

Gemini의 더 많은 킬러 기능은 오랫동안 배치되어 온 화면 읽기 및 정보 수집 기능과 결합되었습니다.

예를 들어, 사용자가 친구에게 파티용 피자 주문에 대해 이야기할 때 사용자는 Gemini에게 직접 전화를 걸어 "주문을 명확히 하세요"라고 말하면, Gemini는 채팅에서 언급된 피자 가게는 물론 특정 피자 종류까지 직접 캡처하여 모두의 요구 사항을 정리할 수 있습니다.


이후 사용자는 테이크아웃 플랫폼 그럽허브(Grubhub)에서 제미니에게 직접 테이크아웃 주문을 요청할 수 있고, AI는 방금 정리된 주문 요건에 따라 백그라운드에서 모든 음식을 자동으로 장바구니에 추가한 뒤 확인 및 주문을 위해 사용자에게 전달한다.


때로는 음식 주문 상황이 원활하게 진행되지 않을 때가 있으며, Gemini는 예상치 못한 상황을 먼저 해결하고 사용자에게 솔루션을 제공하려고 노력할 것입니다. 한번은 피자 가게에서 바쁜 시간에 대형 피자 주문을 제한하면 Gemini가 대신 미디엄 피자 두 개를 주문할 수 있는지 물었습니다.

또 다른 예: 바비큐 파티 참석자 목록을 나열하고 채식주의자를 언급하는 Google Keep 메모입니다. Gemini는 먼저 전체 파티에 필요한 핫도그와 빵의 수를 계산한 다음 재료 구매를 요청할 수 있습니다. 몇 분 안에 모든 품목이 DoorDash 플랫폼의 장바구니에 담깁니다.

Google의 Android 생태계 사장인 Sammer Samat는 Gemini가 이러한 플랫폼을 운영하기 위한 단계와 경로를 미리 "기억"하는 것이 아니라 실제로 인간을 모방하여 화면을 보고 다음 작업을 수행하는 추론 기능을 사용하고 있다고 밝혔습니다. 이는 Gemini가 향후 더 많은 시나리오에서 잠재력을 발휘할 수 있음을 의미합니다.

여기에서 Gemini의 첫 번째 배치가 음식 주문 및 택시 호출 시나리오에 중점을 두고 있다는 것을 알 수 있습니다. 이는 Qianwen이 봄 축제 이전에 했던 것과 더 유사합니다.


출처 : 유선

Android 공식의 또 다른 "빈백 휴대폰"

WeChat 컬렉션을 찾는 데 도움을 줄 수 있는 진정한 "만능" Beanbao 모바일 비서(적어도 보이콧되기 전)에 비해 Gemini의 현재 기능은 택시 호출, 테이크아웃, 식료품 쇼핑과 같은 일일 시나리오에 초점을 맞춰 여전히 상당히 제한적입니다. 근본적인 기술적 역량은 더 강력하지만 사용자의 실제 사용 효과는 홍멍(Hongmeng)의 샤오이(Xiaoyi), 아너(Honor)의 YOYO 등 국내 휴대폰 AI 비서와 크게 다르지 않다.

그러나 기사 시작 부분에서 언급했듯이 Google은 전체 Android 생태계를 보유하고 있으며 절대적인 매력과 통제력을 가지고 있습니다.

Gemini의 자동화 기능 출시와 함께 Google은 그 뒤에 있는 Android 시스템의 기본 레이아웃과 향후 계획도 자세히 공개했습니다. 두 가지 방향이 있습니다. 간단히 말해서,"사과"이기도 하고 "콩주머니"이기도 합니다.

먼저, 구글은 지난해 개발자들이 애플리케이션별 기능을 노출하고 AI 비서가 호출할 수 있는 기능 입구를 제공할 수 있는 'AppFunctions'라는 프레임워크를 출시했습니다.

Google은 AppFunction을 Android의 "모델 컨텍스트 프로토콜"(MCP)과 비교합니다. MCP는 단순히 타사 앱 애플리케이션과 AI 모델을 연결하는 데 도움이 되는 대화 표준으로 이해될 수 있습니다.


이 프레임워크는 Apple의 앱 인텐트와 유사합니다. Apple의 개념에서는 사용자가 Siri를 사용하여 다양한 앱을 조작하여 기능을 구현할 수 있으며, 기본 구현 방법은 App Intents를 통해서입니다. 차세대 Siri가 아직 구현되지 않았다는 전제하에 App Intents만으로도 좋은 결과를 제공하기에 충분합니다.

Google의 AppFunctions도 마찬가지입니다.

예를 들어, 사용자는 친구의 이메일에서 레시피를 찾고 관련 재료를 쇼핑 목록에 추가하라는 명령을 내릴 수 있습니다. AI는 명령을 받은 뒤 먼저 메일앱의 '검색' 기능 항목을 호출해 관련 내용을 검색, 추출한 뒤 메모의 '쇼핑 목록' 항목을 호출해 데이터를 채우고 정리한다.

일부 AppFunction 기능은 Samsung Galaxy S26 및 One UI 8.5 시스템에 구현되었습니다. 예를 들어, 사용자는 Gemini에게 자신의 앨범에서 특정 사진을 찾아 문자 메시지를 통해 친구에게 보내도록 명령할 수 있습니다.

전체 프로세스 동안 Gemini는 사진 앨범과 SMS 앱을 열거나 Gemini 앱을 종료할 필요도 없다는 점에 유의해야 합니다. 대신 AppFunctions를 사용하여 해당 항목을 Gemini에 캡처하여 작업을 수행하므로 더 효율적입니다.

본질적으로 AppFunctions 기반의 구현은 과거 API 경로 로직과 동일합니다. 이것은 일종의 "안녕하세요" 문제 해결 아이디어입니다.


그러나 모든 앱이 적절한 적응을 한 것은 아닙니다. 그것은 중요하지 않습니다. Google은 또 다른 준비를 했습니다.

어제 안드로이드 개발자 블로그에 게재된 기사에서 구글은 AI 비서와 서드파티 애플리케이션이 인간을 모방해 앱을 직접 열고 단계별 작업을 수행할 수 있는 UI 자동화 프레임워크도 개발 중임을 분명히 했다.


——"빈백 휴대폰"의 복제품입니다.

하지만 구글은 앞으로 UI 자동화가 실질적인 '과중한 작업'을 맡게 될 것이라고 밝혔지만, 이번 갤럭시 26 시리즈에서 UI 자동화는 '초기 프리뷰 버전'에 불과하다.


▲ Doubao 휴대폰을 사용하면 샴푸 가격을 비교할 수 있습니다.

AppFunctions가 앱 개발자에게 추가 적응 작업을 수행하도록 요구하는 경우 UI 자동화 프레임워크는 추가 적응 없이 모든 작업을 AI 에이전트에 맡깁니다. 하지만 그 효과는 AI 에이전트의 능력에 따라 크게 좌우된다. 장점은 온라인에 출시되자마자 많은 수의 애플리케이션을 처리할 수 있다는 것입니다.

이제 Google의 Android Gemini 에이전트 계획에서 AppFunctions와 UI 자동화는 서로를 보완하는 두 가지 경로라는 것을 알 수 있습니다. 즉, 표준화되고 추적 가능한 인터페이스 방법을 통해 최대의 호환성을 보장하는 동시에 진정으로 미래를 대표하는 화면 읽기 상호 작용 모델의 기반을 마련하는 것입니다.

구글은 또한 이것이 Gemini의 독점 기능이 아니라 Android 시스템의 기능이 될 것이라고 말했습니다.

이는 또한 향후 휴대폰 제조업체의 자체 내장 AI 도우미이든 ChatGPT와 같은 타사 애플리케이션이든 AppFunctions를 호출하여 작업을 수행하거나 자동 작업을 위해 휴대폰 UI를 "읽을" 수 있음을 의미합니다.

국립은행이 제미니를 사용할 수 없는 경우에도 삼성 갤럭시 S26의 빅스비 어시스턴트는 테이크아웃 주문, 택시 호출, 전자상거래 가격 비교 등의 기능도 실현할 수 있다는 점을 언급할 가치가 있습니다.

우리는 삼성이 Gemini를 대체할 모델 공급업체를 중국에서도 찾았다고 합리적으로 추론할 수 있습니다. 이들 대형 모델 드래곤 중 누가 지난 1년 동안 휴대폰 스마트폰에서 더 뛰어난 성과를 거두었는가에 따라 달라질 수 있다.


AI 휴대폰으로 가는 길은 '외로운 전사'에만 국한되지 않는다

지난해 '빈백 휴대폰'이 눈부시게 데뷔했으나 안타까운 사정으로 조기 종영했다. 매우 유감스럽지만 AI 자동화 모델이 AI 휴대폰의 이상적인 모델인가?

이 질문은 3~5년 동안 답변되지 않습니다. 적어도 Doubao 휴대폰은 혼자가 아닙니다. 안드로이드 시스템을 소유한 구글도 이 길을 선택했고 훨씬 더 큰 발언권을 갖고 있다.


실제로 두바오(Doubao) 휴대폰이 해외에서 인기를 끌자 일부 네티즌들은 구글이 픽셀과 안드로이드 휴대폰에서 이 기술을 홍보한다면 전망이 매우 넓을 것이라고 상상하기 시작했다.

하지만 구글은 'AI 휴대폰'이라는 제안에 대해 명확한 답을 갖고 있지 않다고 생각합니다. AI, 시스템, 하드웨어를 동시에 갖는 것과 비슷합니다. 모든 방향으로 시도해 보면 아마도 방법이 있을 것입니다.

그러나 적어도 구글은 안드로이드를 위한 '시스템 수준 자동화'의 좋은 예를 제시했고, 많은 새로운 휴대폰은 '빈백 폰'이 될 가능성을 갖게 될 것이다.

이 물결은 안드로이드 캠프에서 멈추지 않을 수도 있습니다. 잊지 마세요. Apple은 Google과 협력 관계를 맺었고 Gemini는 Siri의 기술 지원이 될 것입니다. 그리고 앱 의도와 AppFunction은 매우 유사합니다.


AI Siri 데모

조금 더 살펴보면 Gemini 에이전트는 AI 전화기에만 국한되지 않습니다. Sammer Samat의 비전에 따르면 미래의 스마트 안경, AI 펜던트, 심지어 자동차에서도 Gemini가 있는 한 이를 사용하여 복잡한 작업을 완료할 수 있습니다. 물론 이러한 시나리오는 아직 구현되지 않았습니다.

하지만 구글은 기술적인 차원에서만 AI 자동화 노선을 택했을 뿐, 패러다임이 확립됐다고 해서 문제가 사라진 것은 아니다. 당시 두바오가 직면한 다양한 모순은 후발 기업들이 직면해야 할 과제이기도 하다.

물론 첫 번째는 개인정보 보호와 보안입니다. 구글의 파이는 매우 크다. 앞으로는 모바일 앱을 호출하고 운영하는 것이 Gemini에만 국한되지 않을 것입니다. 일부 타사 AI 애플리케이션은 사용자의 데이터 코어에 더 깊이 침투할 수 있습니다. 이러한 인터페이스를 이용하는 위장된 악성 애플리케이션이 있는 경우 더 큰 손실을 초래할 수도 있습니다.


이미지 출처: 9To5Google

더욱 치열한 갈등은 AI 시대의 새로운 '진입'을 두고 휴대폰 하드웨어 제조사, 모델/에이전트 기능 제공자, 대형 플랫폼 애플리케이션 간의 경쟁이다. 이것은 한때 가장 넘기 힘든 벽이었던 원조 빈백 휴대폰이기도 했다.

결국, Gemini를 사용하여 차량을 호출한다는 것은 사용자가 더 이상 Uber의 멤버십 프로모션, 광고 추천을 볼 필요가 없거나 브랜드 고정성을 형성할 필요가 없어 애플리케이션 서비스 제공업체/광고 산업의 수익에 직접적인 피해를 줄 수 있음을 의미할 수 있습니다.

중국에는 인터넷/AI 거대 기업이 있는데, 해외는 어떨까요? Meta 및 Amazon과 같은 오래된 라이벌은 여전히 ​​강력한 플랫폼과 생태계를 보유하고 있지만 Google에 문을 열어 Gemini가 모든 것을 자동화하도록 허용할 의향이 없을 수도 있습니다.

개인 정보 보호, 보안 또는 플랫폼 규칙을 기반으로 하든 제한을 설정하고 액세스 임계값을 높이면 필연적으로 게임이 발생하고 전투가 더욱 치열해질 것입니다.

적어도 구글은 미래에 대해 확신하고 있습니다.Sammer Samat는 AI 기술이 "진행 중인 단계"에 진입했으며 개발자는 이에 맞서 싸우기 위해 머리를 쥐기보다는 이를 수용할 수 있는 적절한 방법을 생각해야 한다고 믿습니다.

새로운 것과 오래된 것의 대결은 피할 수 없으며, 사용자가 많은 국가급 애플리케이션도 영원히 면역되지는 않을 것입니다. 최종 승자는 변화를 앞두고 용감하게 변화를 추구해온 플레이어들이 될 가능성이 높습니다.

참고자료:

https://android-developers.googleblog.com/2026/02/the-intelligent-os-making-ai-agents.html