Apple은 지난 1년 동안 생성 AI의 흥분을 침착하게 관찰하며 생태학적 기반을 구축해 왔습니다. 내년 아이폰 출시를 향해 차근차근 나아가고 있다. 지난 10월 애플 머신러닝 연구팀은 '페렛(Ferret)' 모델(Ferret)을 출시했다. 이 대규모 다중 모드 모델은 GPT-4v보다 공간을 더 정확하게 이해합니다. 최근 이 모델이 오픈소스로 공개되었습니다. 간단히 말해서, 사진 속 어느 곳이든 어떤 물체를 가리키면 그것이 아무리 작더라도 "페럿"은 그것을 명확하게 설명할 수 있습니다.


공간에 대한 이러한 민감성은 자연/가상 시각적 인식과 대규모 언어 모델을 결합한 Apple의 곧 출시될 VisionPro에서 중요한 역할을 합니다. 이 소박한 논문의 저자는 모두 중국인입니다. 최근 업계에서 더욱 주목을 받고 있습니다. 공간 컴퓨팅 분야에서는 SOTA 수준에 도달했습니다.


"Ferret" 모델 아키텍처(출처: FERRET: REFERANDGROUNDANYTHINGANYWHEREATANYGRANULARITY)

Apple은 최근 M3 칩에서 대형 모델을 훈련하고 배포할 수 있는 오픈 소스 프레임워크인 MLX를 출시했습니다. 이는 Mac 노트북 개발자가 대형 모델을 지원하는 애플리케이션을 개발할 수 있음을 의미합니다.

애플은 휴대폰에 탑재된 대형 모델 메모리(DRAM) 부족 문제를 플래시 메모리를 사용해 해결한 '라이트닝 대형 모델(LLMinaFlash)'도 출시했다.

개인적으로 정말 좋아하는 논문입니다. 그렇다, 비밀리에 활동하던 애플도 조용히 논문을 발표하기 시작했다.

본 논문에서는 휴대폰과 같이 매우 제한된 메모리 공간에 대형 모델을 배포하는 방법과 배터리를 소모하지 않고 추론 속도가 빨라야 한다는 작지만 중요한 문제에 대해 설명합니다.

알고리즘을 기반으로 알고리즘을 이야기하는 것이 아니라, 하드웨어에 대한 깊은 이해를 바탕으로 알고리즘과 결합하여 자신만의 방법을 제안한다는 점이 가장 큰 장점입니다. 그 출발점은 전적으로 소비자의 사고이다. 큰 모델은 먼 구름 속에 있습니다. 겁나 크고 비싸네요. 사용자의 주머니에 넣어야만 소비자는 생성 AI에 대한 감각을 가질 수 있습니다.

DRAM은 수십억 모델을 수용하기에는 너무 작습니다. 플래시 메모리에 넣을 수는 있지만 플래시 메모리의 대역폭이 충분하지 않습니다. 플래시 메모리에서 DRAM까지의 대역폭 부하를 최소화하기 위해 Apple은 윈도우잉과 행-열 번들링이라는 두 가지 기술을 혁신했습니다(자세한 내용은 백서 참조).

OPT6.7B와 FALCON7B의 두 모델에서 테스트한 결과는 상당히 "폭발적"이었습니다. 실행할 수 있는 모델의 크기는 사용 가능한 DRAM의 두 배입니다. CPU와 GPU의 단순 로딩 방식에 비해 추론 속도는 각각 4~5배, 20~25배 향상된다.

칩, 운영 체제 및 시스템 설계를 정렬하고 합리적인 비용 모델을 구축하는 방법을 찾는 것은 Apple만이 할 수 있는 일입니다.

최근에는 수십억 개의 매개변수를 갖춘 일련의 소형 모델의 성능이 전 세계를 놀라게 했습니다. 예를 들어 Mistral과 Phi-2는 수백억 개의 매개변수가 있는 대규모 모델에 도전할 수 있습니다. 구글이 픽셀(Pixel) 휴대폰에 직접 설치할 수 있는 18억 개의 매개변수를 갖춘 나노 수준의 제미니(Gemini) 모델을 출시했다. Qualcomm의 Snapdragon 칩은 수백억 개의 매개변수 수준 모델을 실행할 수 있습니다. 삼성은 2024년 초에 생성 AI 게임 기능을 갖춘 갤럭시 S24 휴대폰을 출시할 수도 있습니다.

상하이 교통대학교 팀이 출시한 추론 엔진 PowerInfer도 있는데, 이는 특히 휴대폰과 노트북 등 기기 단말기에 대형 모델을 배포하는 데 있어 장애물을 하나씩 제거해 왔습니다. 이는 또한 2024년에는 가전제품이 대형 모델 탑재의 물결을 몰고 올 것임을 시사합니다.

이러한 '소형' 모델의 출시에는 고품질 데이터, 즉 '교과서 수준' 데이터를 사용한다는 공통점이 있습니다. 의심할 바 없이, 주류 뉴스 매체의 자료실은 좋은 언어 훈련 자료를 제공할 수 있습니다.

Apple은 Siri의 대화 서비스를 사용할 수 있는 자체 대형 모델을 교육하기 위해 약 5천만 달러에 이러한 미디어의 아카이브 코퍼스를 확보하기 위해 미국의 주요 미디어 조직과 협상하고 있습니다.

이러한 교육 자료, Conde Nast의 Vogue, New Yorker, NBCNews 및 IAC의 People, TheDailyBeast, BetterHomes, Gardens 등의 품질을 생각해 보십시오. 여기에는 패션 및 라이프스타일 콘텐츠를 담은 아름다운 텍스트와 이미지가 풍부하게 포함되어 있습니다. 또한 선택된 뉴스 기사, 이미지 및 비디오도 포함됩니다.

그러나 다른 주류 언론은 별로 관심을 보이지 않았다. 과거에는 인쇄 매체와 소셜 미디어의 협력이 큰 이익을 가져다주지 못했습니다. 또한 언론은 대형 모델을 훈련시키기 위해 아카이브에 있는 뉴스를 Apple에 넘겼습니다. 이용 과정에서 발생할 수 있는 법적 분쟁도 이들 언론을 불안하게 만들었다.

Apple의 접근 방식이 더 정통한 것으로 간주됩니다. 다른 AI 기업이나 기술 대기업들은 먼저 다른 사람의 말뭉치를 사용했다가 적발된 뒤 라이선스 협상을 벌여 소송을 촉발하기도 했다.

Apple은 개인 정보 보호를 강조하기 때문에 인터넷에서 직접 데이터를 긁어내는 것을 꺼립니다. Apple은 또한 고객에 대한 데이터를 수집하는 것이 허용되지 않습니다.

그렇다면 애플은 2024년에 무엇을 할 것인가?

모두가 가장 먼저 생각하는 것은 생성 AI로 구동되는 언어 비서인 Siri가 내년에 출시된다는 것입니다. 2024년 가을 iPhone16과 iOS18의 가장 큰 하이라이트가 될 것입니다. 일부 Apple 팬들은 SiriGPT를 출시할 것이라고 농담했습니다. 그러나 이는 빙산의 일각에 불과합니다.

거대 기업의 접근 방식은 일반적으로 고유한 핵심 역량을 강화하고 원래 제품의 차별화를 창출하기 위해 새로운 기술을 찾는 것입니다. 표면적으로 애플은 생성 AI를 천천히 진행하고 보수적인 후속 전략을 채택하면서 성공에 안주하고 있는 것처럼 보입니다. 아니면 Apple이 실제로 칩, 운영 체제 및 대형 모델의 통합 통합 기능과 제품 설계 기능을 사용하여 최고의 AI 제품 경험을 만들 수 있을까요? 대답은 아마도 후자일 것이다.

지난 몇 년 동안 Apple은 제품, 서비스 및 생태계에 사용할 수십 개의 AI 스타트업을 인수했습니다. 다만 여기에는 스타급 스타트업이 없다는 것 뿐이다.

Apple은 일만 할 뿐 그것에 대해 이야기하지는 않습니다. 분석가들은 AI에 대한 Apple의 투자가 Microsoft의 투자와 적지 않다는 점을 오랫동안 알아차렸습니다. Apple은 생성적 AI 애플리케이션 개발을 위한 인프라를 구축하는 데 수백억 달러를 지출했습니다. 앞서 애플이 자체 대형 모델인 Ajax(AppleGPT)를 내부적으로 비밀리에 훈련하고 있다는 소문이 돌았는데, 당시에는 GPT-3.5를 따라잡을 수 있을 것이라는 소문이 돌았다.

그러나 최근 일련의 Apple 머신러닝 연구 결과는 Apple이 자신만의 길을 가고 있음을 보여줍니다. Microsoft, Google, Amazon, NVIDIA 및 OpenAI로 대표되는 비공개 소스 대형 모델 회사는 모델, 클라우드 및 컴퓨팅 성능을 중심으로 첫 수확을 거두었습니다.

Apple이 중요하게 생각하는 것은 20억 대의 디바이스와 사용자로 구성된 거대한 생태계입니다. 생성적 AI가 가져온 새로운 iPhone 경험과 모든 애플리케이션을 지원하는 대형 모델의 사용은 다른 거대 기업이 빼앗기 어려운 소비자 시장 기회를 Apple에 가져옵니다. 개인 정보 보호라는 이름으로 Apple은 타사 응용 프로그램 간의 상호 액세스를 제어하며, 이로 인해 Apple Store는 미래의 AI 응용 프로그램을 위한 금광이 됩니다.

애플은 느린가? 생성 AI의 환각 문제는 물론 규제, 개인 정보 보호, 저작권 분쟁 등은 Apple이 더 깊이 생각하고 신중하게 고려하게 만들 것입니다. Apple은 칩, 운영 체제, 응용 프로그램, 제품 및 제조를 포함한 모든 수준의 통합 설계가 궁극적으로 경쟁사가 따라잡기 어려울 수 있는 혁신적인 깊이의 제품 경험을 가져올 것이기 때문에 그러한 확신을 갖고 있습니다.

OpenAI가 촉발한 'iPhone 모멘트'는 여러 차례 외쳤지만, 다음 애플은 여전히 ​​애플일 것이다.

참고 논문:

https://arxiv.org/pdf/2312.11514.pdf

https://arxiv.org/pdf/2310.07704.pdf

저자/저우장공

관련 기사:

Apple "Ferret" - 새로운 오픈 소스 기계 학습 모델