2023년 엔비디아는 거의 1년 내내 고급 그래픽 카드, 대형 AI 모델, 슈퍼컴퓨팅, 기타 데이터센터 사업에 집중해왔기 때문에 엔비디아가 PC 시장에서 글로벌 시장을 독점하는 하드웨어 '무기 딜러'이기도 한다는 사실을 시장은 거의 망각할 정도였습니다. 실제로 엔비디아는 데이터센터 사업으로 많은 돈을 벌면서도 그 뿌리를 잊지 않았다. Huang Renxun은 이미 AI를 사용하여 "e스포츠 의자와 책상"에서 돈을 버는 방법을 알아내기 시작했습니다.
방금 끝난 2024CES에서 NVIDIA는 PC 측면에서 수많은 새로운 AI 애플리케이션과 GPU 제품을 출시했습니다.GeForce RTX40SUPER 시리즈 그래픽 카드, NVIDIA AI Workbench, 오픈 소스 라이브러리 TensorRT-LLM, 생성 AI 기반 음성 및 애니메이션 모델을 포함한 NVIDIAACE 마이크로서비스.
일련의 PC 측 GPU 제품 및 애플리케이션은 모두 올해 CES에서 PC 제조업체가 가장 우려하는 주제인 AIPC에 중점을 두고 있습니다. 그러나 AI에 초점을 맞춘 NVIDIA의 경우 PC 사용자에 대한 '배려'는 여전히 얼마나 유지됩니까? 업계에서 뜨거운 논란이 되고 있는 AIPC에 대한 엔비디아의 태도는 어떤 것일까요?
PC사업 전망은 데이터센터만큼 좋지 않다
실제로 2023년 대형 AI 모델이 등장하기 전까지 엔비디아의 가장 큰 시장은 언제나 PC 쪽 '게임' 부문이었다.
엔비디아는 2015년부터 주요 사업을 게임, 기업, 고성능 컴퓨팅 및 클라우드(HPC&Cloud), 자율주행(자동차)으로 나누었습니다.또한 2015년부터 미래 데이터센터 사업인 슈퍼컴퓨팅과 클라우드가 엔비디아 매출에 차근차근 오르기 시작했다.
2016년에 NVIDIA는 비즈니스 부문을 조정하여 엔터프라이즈 및 HPC & 클라우드 부문을 제거하고 이를 오늘날의 프로페셔널 시각화(ProfessionalVisualization) 및 데이터 센터(Datacenter)로 대체했습니다. NVIDIA는 또한 처음으로 이러한 사업 부문의 수익을 별도로 발표했습니다. 게임 비즈니스의 대상 사용자는 개인용 컴퓨터인 반면, 전문 시각화 사용자의 대부분은 상용 고객이 사용하는 워크스테이션입니다.
2016년 NVIDIA의 총 수익은 50억 1천만 달러였습니다. 2016년 1월 31일에 종료된 회계연도에 NVIDIA의 게임 사업 수익은 28억 1,800만 달러였습니다. 전문 시각화 사업 수익은 7억 5천만 달러였습니다. 데이터 센터 사업 수익은 3억 3900만 달러였습니다. 자율주행 사업 매출은 3억2000만달러였다.
이 중 게임사업과 전문시각화사업이 각각 전체 매출의 56.25%와 14.97%를 차지했다. 본격적으로 운영되고 있는 오늘날의 데이터센터는 당시 전체 매출의 6.77%에 불과했다.
개인용 컴퓨터 시장은 안정세를 유지하고 있지만, 시장은 한계점에 도달한 것 같습니다. 성장률이 제한적일 뿐만 아니라 기술적 한계가 높지 않기 때문에 이 분야의 시장 경쟁도 점점 치열해지고 있습니다.
2017년과 2018년에는 AI 기술이 처음으로 폭발적으로 성장했습니다. NVIDIA에 새로운 성장 곡선을 가져옵니다.
2018 회계연도에는 GPU 가속 컴퓨팅의 딥 러닝 지원으로 NVIDIA의 데이터 센터 비즈니스가 빠르게 성장할 수 있었습니다. 그 해 데이터센터 사업 매출은 193억 2천만 달러였으며, 전문 시각화는 93억 4천만 달러였습니다. 데이터 센터 수익과 성장은 전문적인 시각화를 훨씬 능가합니다.
데이터센터 사업의 급속한 발전은 Nvidia를 전통적인 게임 하드웨어 공급업체에서 다각화된 기술 회사로 만들었다고 할 수 있습니다.
시장조사기관 TBRC는 2024년 1월 발표된 최신 보고서에서 다음과 같이 예측했다.세계 개인용 컴퓨터 시장 규모는 2023년 약 2,040억 9천만 달러에서 2024년까지 2,123억 8천만 달러로 연평균 복합 성장률(CAGR) 4.1%로 성장할 것으로 예상됩니다.개인용 컴퓨터 시장의 규모는 앞으로도 계속 성장할 것으로 예상됩니다. 2028년에는 연평균 성장률 6.0%로 2,677억 1천만 달러로 증가할 것으로 예상됩니다.
데이터센터의 시장 규모와 성장 잠재력은 개인용 컴퓨터보다 크다.2023년 글로벌 데이터센터 시장 규모는 약 2,526억 8천만 달러로 개인용 컴퓨터 시장 규모보다 약 20% 더 커질 전망이다. 연평균 복합 성장률(CAGR)은 8.8%로 2024년까지 2,749억 8천만 달러로 성장할 것으로 예상됩니다. 아직 아님데이터 센터 시장 규모의 성장도 지난 몇 년 동안 더욱 강력해졌습니다. TBRC는 이 시장 규모가 2028년까지 연평균 성장률(CAGR) 9.0%로 3,884억 1천만 달러로 증가할 것으로 예측하고 있습니다.
개인용 컴퓨터 사업에 비해 데이터 센터는 현재와 미래 모두에서 시장 규모, 시장 경쟁 패턴, 사용자 요구, 기술 개발 동향 측면에서 분명히 더 좋고 더 수익성이 높습니다.
데이터 센터의 수익성은 얼마나 됩니까?
NVIDIA의 최근 회계연도 2024년 3분기 재무 보고서에 따르면, 급격히 증가하는 데이터 센터 사업 수익은 1,451억 4천만 달러로 전체 수익의 80%를 차지하며 PC 측면에서 NVIDIA의 전통적인 핵심 비즈니스 '게임'을 완전히 무너뜨렸습니다. NVIDIA에게 데이터센터 사업은 현재와 미래에 가장 수익성이 높고, 가장 빠르고, 가장 쉽게 돈을 벌 수 있는 사업입니다.
오늘날의 기술 동향은 데이터센터 비즈니스의 핵심 동인인 클라우드 컴퓨팅, 빅데이터, 인공지능, 머신러닝 등의 영역을 강하게 가리키고 있습니다.
AI는 높은 컴퓨팅 성능과 슈퍼 컴퓨팅 성능에 대한 기업의 요구를 지속적으로 증가시키고 있습니다. 2023년 중반, 기술 블로그 GPUUtils에서 GPU 부족 문제에 대한 조사를 실시했습니다. 블로거 Clay Pascal이 제공한 설문 조사 결과에 따르면 당시 Google Cloud에는 약 25,000개의 H100이 있었고 Microsoft 클라우드 서비스 Azure에는 10,000~40,000개의 H100이 있을 수 있습니다. 오라클의 상황도 비슷할 것이다. Azure 용량의 대부분은 OpenAI로 이동됩니다.
Clay Pascal은 H100에 대한 수요로 OpenAI가 50,000위안, Meta가 25,000위안, 대규모 클라우드 공급업체가 각각 30,000위안이 필요할 수 있다고 예측합니다. 게다가 다른 스타트업에도 총 약 432,000 H100이 필요할 수 있습니다. 블록당 약 35,000달러로 필요한 GPU의 가치는 약 150억 달러입니다. 여기에는 중국 기업이 포함되지 않습니다.
Clay Pascal은 블로그에 다음과 같이 썼습니다. 100개 또는 1000개(Nvidia GPU) H100이 필요한 회사의 경우 Azure(Microsoft 클라우드 서비스) 및 GCP(Google 클라우드 서비스)는 사실상 용량이 없으며 Amazon은 용량이 거의 없다고 들었습니다.
연구기관 옴디아(Omdia)의 조사 결과에 따르면,Nvidia는 2023년 3분기에 거의 500,000개의 A100 및 H100 GPU를 판매했으며, H100 기반 서버의 리드 타임은 36~52주로 연장되었습니다.현재 NVIDIA의 보충 상황은 모르겠지만 OpenAI의 최근 네트워크 단절, 계정 정지, 신규 기능 업그레이드 등으로 판단하면 보충 능력과 관계없이 여전히 수요 격차가 큽니다.
엄청난 수요에 직면하여 NVIDIA도 가격 인상을 시작했습니다. 칩 산업에서는 일반적으로 고급 제품의 이윤폭이 더 높으며, 많은 고급 제품의 이윤율이 50% 이상입니다. 그리고 Nvidia의 고급 GPU 이윤폭은 엄청나게 높습니다.투자은행 레이몬드 제임스(Raymond James)에 따르면 H100 GPU의 가격은 미화 3,320달러에 불과하지만 엔비디아는 이를 2만5,000~3만달러에 판매하며 이윤폭은 최대 1,000%에 이른다.
요즘 NVIDIA a100 및 H100 서버의 가격은 중국에서 매우 높습니다.2023년 마지막 3개월 동안 8카드 H100 서버의 가격은 한때 300만 위안에 도달했습니다.
Nvidia에는 AIPC가 얼마나 필요합니까?
데이터 센터는 수익성이 매우 높습니다. 이는 NVIDIA가 PC 시장에 대한 집중을 약화한다는 의미입니까?
단기적으로는 그렇지 않을 것 같아 두렵습니다. 결국 PC는 지난 30년간 엔비디아의 주력 전쟁터였다. 여기서 Nvidia는 장점과 경험뿐만 아니라 더 중요한 것은 자신감을 가지고 있습니다.
PC 시장, 특히 게임 및 전문 그래픽 처리는 오늘날 Nvidia의 중요한 수익원으로 남아 있습니다. Nvidia의 2024 회계연도 3분기 결과는 다음과 같습니다.게임사업 매출은 285억6000만달러로 전년 동기 대비 80% 이상 증가했다.게임 산업의 발전과 가상현실 기술의 발전으로 PC 시장의 성장 잠재력은 여전히 크다.
반면 엔비디아는 PC 시장에서도 독점 지위를 갖고 있다.2022년 글로벌 독립 GPU 시장에서 엔비디아의 시장 점유율은 88%인 반면, AMD와 인텔은 각각 8%, 4%에 불과하다.
더 중요한 것은 Nvidia의 풍부한 GPU 제품 라인이 PC 시장에서 장기적인 배송 이점을 제공할 수 있다는 것입니다. NVIDIA는 게이머와 제작자를 위한 Ampere, 데이터 센터를 위한 Hopper3를 포함하여 다양한 사용자 요구 사항을 충족하는 다양한 GPU 제품을 제공합니다. NVIDIA는 또한 드라이버, 개발 도구 및 애플리케이션으로 구성된 포괄적인 생태계를 구축했습니다.
현재 상황으로 볼 때 NVIDIA의 RTX40 시리즈 그래픽 카드가 PC에서 새로운 AI 서비스를 지원할 수 있다면 앞으로도 이 100억대 시장을 독점할 것입니다. AI 기술 고도화를 통해서도 개인용 PC 시장의 GPU 탑재율을 더욱 확대하고 글로벌 시장을 한 단계 더 끌어올릴 예정이다.
2023년 데이터센터 사업은 무서운 속도로 성장할 전망이다. 이는 AI 대형 모델이라는 신기술의 등장과 밀접한 관련이 있다. 하지만,글로벌 기술 시장에서 AI 대규모 모델은 아직 초기 단계에 있습니다. 앞으로 얼마나 지속가능한 성장이 이루어질지, 클라우드 서버에 대한 수요가 어떻게 될지는 알 수 없습니다.
PC 사업은 지난 30년 동안 안정적인 성장 곡선을 시작했습니다. 엔비디아는 분명 수익성이 더 높고 성장 잠재력이 더 큰 데이터센터 사업에 투자하는 데 집중하겠지만, 이미 확고한 기반을 구축한 PC 사업 시장을 포기하지는 않을 것이라고 짐작할 수 있다.
RTX40 시리즈의 기회와 과제
AIPC 개념은 시장에서 뜨거운 관심을 받고 있으며, 많은 제조업체에서는 클라우드 컴퓨팅 비용을 줄이고 보안 및 대응 효율성을 높이기 위해 AI를 로컬로 구현하도록 제안하고 있습니다. 이는 의심할 여지 없이 PC 측 GPU에 대한 새로운 시장 기회를 창출합니다.
2024CES에서 출시된 Nvidia의 최신 GeForceRTX40SUPER 시리즈 그래픽 카드 중,GeForceRTX4080SUPER는 GeForceRTX3080Ti에 비해 AI 영상 생성에서는 1.5배, 이미지 생성에서는 1.7배 빠릅니다.SUPERGPU의 TensorCore는 초당 최대 836조 개의 AI 연산(TOPS)을 달성할 수 있어 게임, 창작 및 일상 생산성에 혁신적인 AI 기능을 제공합니다.
NVIDIA AI Workbench를 사용하면 개발자는 사전 훈련된 생성 AI 모델과 LLM(대형 언어 모델)을 빠르게 생성, 테스트 및 맞춤 설정할 수 있습니다. TensorRT-LLM은 PC에서 대규모 언어 모델 실행을 가속화하기 위한 오픈 소스 라이브러리입니다. 이제 최신 버전의 TensorRT-LLM을 사용할 수 있습니다. PC에 사전 최적화된 모델이 더 많이 추가되고 다른 추론 백엔드보다 최대 5배 더 빠르게 실행됩니다.
또한 NVIDIA는 생성적 AI 기반 음성 및 애니메이션 모델을 포함한 NVIDIA ACE 마이크로서비스도 출시하여 개발자가 지능적이고 역동적인 디지털 캐릭터를 게임에 추가할 수 있도록 했습니다. 또한 엔비디아는 소위 '검색 증강 생성(RAG)' 기술을 통해 AI 마니아들이 PC의 대형 언어 모델(LLM)을 자신의 데이터에 쉽게 연결할 수 있는 'ChatwithRTX' 기술 시연도 공개했습니다.
이러한 신제품은 생성적 AI에 광범위하게 최적화되어 GPU가 미래 AIPC에서 강력한 성능을 발휘할 수 있는 기회를 제공합니다.
흥미롭게도 연구팀은 최근 RTX가4090은 특정 조건에서 서버급 칩을 대체할 수도 있습니다.
Shanghai Jiao Tong University의 연구팀은 PowerInfer라는 고성능 CPU/GPU 하이브리드 LLM 추론 엔진을 개발했습니다. 이 엔진은 GPU 메모리 요구 사항을 크게 줄이고 CPU와 GPU 간의 데이터 전송을 줄여 전반적인 효율성을 향상시킵니다. LLM(대형 언어 모델)은 단일 NVIDIARTX4090 GPU에서 실행될 수 있으며 초당 평균 13.20 토큰 속도에 도달하고 최대 속도는 29.08 토큰/초에 달합니다. 이는 상위 A100 GPU 서버 성능과 거의 동일하며 18%만 낮으며 다양한 LLM 애플리케이션 시나리오에 적합합니다.
PC 측 GPU는 AI의 지원으로 엄청난 기회를 얻습니다. 그러나 AIPC 트렌드의 경쟁은 하이엔드 GPU의 경쟁보다 더 치열합니다.
오늘날 AMD와 Intel은 더 이상 NVIDIA가 직면한 유일한 경쟁사가 아닙니다.Apple의 M 시리즈 칩이 제안한 UMA(Unified Memory Architecture)는 생성 AI의 사전 훈련 프로세스에 대한 옵션을 제공합니다.
UMA를 사용하면 CPU와 GPU가 동일한 물리적 메모리를 공유할 수 있으므로 서로 다른 메모리 간에 데이터를 복사할 필요성이 줄어들고 효율성이 향상됩니다. 또한 Apple의 하드웨어 최적화를 통해 AI 관련 작업을 수행할 때 장치가 더 적은 에너지를 소비할 수 있습니다. Apple 하드웨어와 소프트웨어의 고도로 통합된 특성은 특정 AI 애플리케이션에 더 나은 최적화 공간을 제공합니다.
현재 많은 수의 AI 대형 모델 개발자가 Apple 컴퓨터를 사용하여 대형 언어 모델을 훈련하기 시작했습니다.MacStudio의 최신 최고급 버전은 이미 700억 개의 매개변수를 사용하여 LLaMA2 모델을 훈련할 수 있습니다.
그러나 UMA에는 많은 장점이 있지만 Apple 자체 생태계 내에 더 집중되어 있으며 외부 시스템과의 호환성이 제한될 수 있습니다. 그리고 전문 GPU와 비교할 때 Apple의 하드웨어는 매우 복잡한 AI 모델을 처리할 때 성능 병목 현상이 발생할 수 있습니다.
엔비디아는 수년간 AI 분야에 깊이 관여해 왔으며, 애플이 단기간에 따라잡기 힘든 탄탄한 기술 축적과 광범위한 애플리케이션 생태계를 보유하고 있다. Apple UMA가 어떤 측면에서는 NVIDIA에 도전이 될 수 있지만, AI 분야에서는 NVIDIA의 GPU가 여전히 매우 경쟁력이 있습니다.
PC 사업이 중국 시장을 살릴 수 있을까?
Huang Renxun은 NVIDIA의 2024 회계연도 3분기 실적 발표에서 NVIDIA 비즈니스의 20~25%가 중국에서 발생한다고 언급했습니다. 중국에 대한 미국의 고급 칩 제재는 NVIDIA에 심각한 영향을 미칠 것입니다.
2023년 8월 영국 '파이낸셜 타임즈'는 중국 클라우드 제조업체들이 엔비디아의 고급 GPU 구매를 서두르고 있다는 소식을 보도하면서 바이두, 바이트댄스, 텐센트, 알리바바 등 4개 기업이 엔비디아로부터 총 50억 달러 규모의 AI 칩을 주문했다고 전했다. 미국 제재 법안의 영향으로 NVIDIA는 이러한 주문을 완전히 이행할 수 없습니다.
중국에서 사업을 유지하기 위해 Nvidia는 다시 한번 3개의 "중국 전용" 칩을 적극적으로 설계하기 시작했습니다.
국내 서버 제조업체는 최근 Huxiu에게 다음과 같이 밝혔습니다.Nvidia가 어떤 칩을 출시하든 모든 서버가 NV-Link에 적응하기만 하면 되기 때문에 칩 제한 정책은 국내 서버 생산에 영향을 미치지 않습니다.새로운 "China Special Supply" 칩을 탑재한 서버는 이미 많은 고객으로부터 주문을 받았습니다. 그러나 미국 정부의 강화된 통제 영향으로 인해 원래 2024년 1월에 도착할 예정이었던 '중국 특별 공급'은 이제 확실히 연기될 것입니다.
바이든 행정부는 엔비디아가 중국을 위해 개발한 새로운 AI 칩 3종에 대한 구체적인 세부 사항을 조사하기 시작한 것으로 알려졌다. 지나 라이몬도 미 상무장관은 외신과의 인터뷰에서 "우리는 모든 새로운 칩의 모든 사양을 점검해 그것이 수출 통제를 위반하지 않는지 확실히 확인할 것"이라고 말했다.
Raimondo는 엔비디아가 "대부분의 AI 칩이 상업용 애플리케이션에 사용될 것이기 때문에 AI 칩을 중국에 판매할 수 있고, 판매할 예정이며, 판매해야 한다"고 말했습니다. 그러나 "우리는 중국이 최첨단 모델을 훈련할 수 있는 가장 복잡하고 처리 능력이 뛰어난 AI 칩을 출시하는 것을 허용할 수 없습니다."라고 말했습니다. 그녀는 자사의 최첨단 반도체를 중국 기업에 판매할 수 없으며 수출 통제 규정이 지속적으로 업데이트될 것이라고 강조했습니다.
미국의 중국 칩 봉쇄는 중국에 대한 제재라기보다는 엔비디아에 대한 제재다.
1월 7일 미국 '월스트리트저널'은 "엔비디아가 중국에서 겪는 새로운 딜레마, 고객들이 다운그레이드된 칩을 원하지 않는다"고 보도했다.엔비디아는 바이든 행정부의 수출 규제에 대응해 자사 AI 칩의 다운그레이드된 특별 버전을 중국에 판매했지만, 중국 고객들은 이번 딜레마에 관심이 없었다.
실제로 중국 내 RTX40 시리즈 그래픽카드 판매가 순탄치 않을 수도 있다. 소식통에 따르면 Nvidia가 현재 중국에서 판매할 수 있는 최고급 칩은 RTX4090D입니다. 이 새로운 칩의 성능은 RTX4090보다 약 5% 낮습니다. NVIDIA는 이 제품이 2024년 1월부터 중국에서 출시될 것이라고 소개했습니다.
이 문제에 정통한 소식통에 따르면 엔비디아는 중국 고객과의 관계를 완화하기 위해 '중국 특별 공급'을 적극적으로 개발하는 동시에 중국 서버 제조업체와도 협상 중이며, 중저가 서버 및 PC 사업에서 일부 양보를 통해 주문했지만 주문을 취소하지 않으면 배송이 불가능한 고급 칩 제품을 다른 제품으로 대체할 수 있기를 희망하고 있다고 Huxiu에 밝혔습니다.
하지만 중국 AI 기업의 경우 GPU 칩을 완전히 차단하지 않는 것은 AI 연구개발 전력을 차단하는 것과 같다. 그러나 이는 중국 칩 기업들에게는 좋은 소식이 될 수 있다.