적자 사업에서 1000% 수익까지, Nvidia는 어떻게 1조 달러 규모의 GPU 대군주가 되었습니까?

2023년 6월 13일, NVIDIA의 시장 가치는 1조 달러를 넘어 Apple, Microsoft, Alphabet, Amazon에 이어 두 번째로 미국에서 5번째로 큰 시가 총액 회사가 되었습니다. 2분기 엔비디아의 데이터센터 사업 매출은 100억 달러를 넘어섰는데, 이는 인텔과 AMD의 매출을 합친 것보다 높았다.

구매 페이지를 방문하세요:

JD.com NVIDIA 시리즈 제품 요약

GPU 칩은 글로벌 거대 기업 간의 슈퍼컴퓨팅과 대형 모델 훈련 경쟁에서 중요한 역할을 하며, 글로벌 GPU 시장 점유율의 80%를 점유하는 엔비디아는 많은 돈을 벌었습니다. 그러나 이러한 독점시장점유율은 하루아침에 지어진 '성벽'이 아니다.

Tractica 데이터에 따르면 전 세계 AI 하드웨어 시장 매출은 2025년까지 2,349억 달러에 이를 것으로 예상되며, 이 중 GPU 매출이 23.2%를 차지할 것으로 예상됩니다.

NVIDIA는 GPU 시장에 해자를 구축했으며 CUDA는 그 핵심 부분입니다.

완전한 컴파일러 생태계

2006년 AMD가 ATI를 인수하고 Intel이 여전히 세계 최대의 칩 제조업체였을 때 NVIDIA는 NVIDIA가 개발한 병렬 컴퓨팅 플랫폼이자 프로그래밍 모델인 CUDA(Compute Unified Device Architecture)를 출시했습니다.

AI 마스터 Andrew Ng는 CUDA의 중요성에 대해 다음과 같이 간략하게 설명했습니다. "CUDA가 출현하기 전에는 GPU로 프로그래밍할 수 있는 사람이 전 세계에 100명도 채 되지 않았을 것입니다. CUDA를 사용하면 GPU를 사용하는 것이 매우 쉬워졌습니다."

대부분의 CUDA 추천자들은 CUDA의 완전한 컴파일러 생태계가 고성능 컴퓨팅 분야에서 NVIDIA GPU의 성공의 열쇠라고 믿습니다.

특히 CUDA는 쉬운 배포, 유연한 개발 인터페이스, 프로그래밍 언어 적응, 완벽한 도구 및 코드 라이브러리 등의 장점을 갖고 있으며 Windows, Linux 및 MacOS와 같은 여러 운영 체제와 호환됩니다.

CUDA의 발전으로 GPU는 더 이상 단순한 그래픽 프로세서가 아니며, 적용 대상도 게임 제작자에서 과학자, 엔지니어, 예술가로 바뀌었습니다.

지속적인 반복을 통해 CUDA는 AI 또는 신경망 딥 러닝 분야에서 수많은 가속 라이브러리를 출시하여 CUDA의 소프트웨어 및 하드웨어 생태계를 형성했습니다.

David Rosenthal은 Acquired.FM에서 CUDA 코드 라이브러리가 최적화되어 개발자가 프로그램 개발을 위해 이러한 라이브러리를 호출하는 것이 더 편리해졌다고 소개했습니다. 따라서 CUDA는 거대한 커뮤니티 리소스를 보유하고 있으며 등록된 개발자 수는 2023년 5월에 400만 명으로 증가할 것입니다.

CUDA 생태계에 100억 달러 이상 투자

NVIDIA는 CUDA로 트레이닝 칩 시장을 거의 독점했으며 업계에서 CUDA 생태계에 파괴적인 영향을 미친 거대 기업은 거의 없습니다.

NVIDIA는 10년 넘게 CUDA 생태계를 위한 길을 닦아왔습니다.

2007년에 Nvidia의 GPU R&D 기술은 이미 강력한 위치를 차지했습니다. 이듬해 인텔의 주요 고객인 애플은 맥북을 CPU 외에 엔비디아의 테슬라 아키텍처 GPU로 직접 교체했다.

보고서에 따르면 지난 수년간 CUDA에 대한 Nvidia의 총 투자액은 100억 달러를 초과했습니다.

Huang Renxun의 상용화 고려 사항에 따라 CUDA 생태계는 잠재적인 개발자를 양성하고 프로그래머와 기업이 환영하는 기술 플랫폼이 되어야 합니다.

2006년 CUDA를 출시한 후 NVIDIA의 첫 번째 전략은 "소프트웨어 개발자"를 대상으로 했으며 개발자가 CUDA 플랫폼 사용에 익숙해지도록 하는 데 많은 투자를 했습니다.

초기에는 개발자 커뮤니티에서 다음과 같은 말이 있었습니다. 프로그래밍 언어와 공유 메모리 수준 모두에서 CUDA의 병렬 처리가 프로그래밍을 단순화하여 학부생이 CUDA를 사용하여 대규모 고성능 컴퓨팅 프로그램을 작성할 수 있게 해준다는 말이 있었습니다.

적용 범위를 확대하기 위해 NVIDIA는 CUDA를 대학 강의실에 도입하고 일리노이 대학과 같은 대학과 협력하여 함수 라이브러리를 개선했습니다. 2010년에는 250개 대학에서 CUDA 교육 과정을 개설했으며 수천 건의 관련 논문이 있었습니다. 이를 바탕으로 NVIDIA는 생태계 개선을 위해 연구 센터, 교육 센터, 인증 프로그램을 설립했습니다. 2015년까지 800개 대학에서 관련 강좌를 개발했습니다.

업계 관점에서 NVIDIA는 스타트업이 CUDA를 사용하여 프로젝트의 기반을 마련할 수 있도록 인셉션 프로그램(스타트업 가속화 프로그램)에 투자했습니다.

현재까지 100개 이상의 스타트업이 CUDA를 활용했습니다. 또한 엔비디아는 Cub, NCCL 등 공통 시나리오를 위한 오픈소스 개발 라이브러리를 보유하고 있으며, 제조사가 사용할 수 있도록 미들웨어 성능을 최적화하는 기본 라이브러리를 제공하며 생태계를 다시 한 번 확장했습니다.

따라서 많은 개발자들이 CUDA에 의존하고 있으며, 강력한 핵심 역량으로 인해 소비자 시장에서 선호되고 있습니다.

2012년 ImageNet 경쟁에서 우승한 AlexNet이 출시된 후 CUDA는 동적 라이브러리와 GPU 포인터를 지원하는 버전 5.0으로 반복되었습니다.

OpenAI가 설립된 2016년 CUDA8.0은 이미 반정밀도 부동 소수점 수와 텐서 코어를 지원했으며, 소프트웨어 생태계는 학계와 업계 관계자 사이에서 서로 잘 알려져 추천되었습니다.

2022년 말 ChatGPT의 출시로 생성 AI가 사람들의 눈에 들어올 것입니다. CUDA12.0은 새로운 NVIDIA Hopper 및 NVIDIA Ada Lovelace 아키텍처 기능을 지원하고 모든 GPU에 대한 추가 프로그래밍 모델 향상 기능을 제공합니다.

대형 모델의 인기가 다양한 기업으로 확산될 무렵, NVIDIA는 업계 내 차별화를 심화하고 장바구니에서 시장 플레이어의 첫 번째 선택이 되었습니다.

현재까지 100만 개 이상의 CUDA 기반 GPU가 판매되었습니다.

많은 GPU 칩 제조업체 중에서 NVIDIA가 유일한 CUDA 개발 환경인 이유는 무엇입니까?

적자사업에서 1000% 수익으로

세기 초 엔비디아와 마이크로소프트, ATI, AMD, 인텔 5대 거대 기업 간의 난투를 돌이켜보면 엔비디아는 점차 그래픽 처리 시장에서 우위를 점하게 되었습니다.

2006년 7월, AMD는 54억 달러의 프리미엄으로 ATI를 인수하여 칩 시장을 재편했습니다. 같은 해 엔비디아의 수석 과학자 데이비드 커크(David Kirk)는 3D 렌더링의 주요 작업에서 벗어나 일반적인 컴퓨팅 작업을 탐색하기 위해 "GPU 기술 일반화"라는 아이디어를 제안했습니다.

이 아이디어가 CUDA입니다. 당시 이 비싸고 힘든 기술을 기꺼이 받아들인 것은 Nvidia였습니다.

여러 주요 칩 회사 중에서 GPU R&D는 오랜 라이벌인 AMD가 ATI를 인수하고 인텔이 자체 개발한 GPU 계획을 취소한 이후 약세를 보이고 있습니다. NVIDIA는 GPU 기술 분야에서 거대 기업을 뒤처지게 되었습니다.

17년 전만 해도 CUDA를 개발하는 것은 성급한 결정이었습니다. NVIDIA의 CUDA 진화는 순조롭게 진행되지 않았으며 Huang Renxun은 "가속 컴퓨팅"이 미래라고 주장했습니다.

Nvidia와 Intel은 2006년 가을에 새로운 CUDA 기반 GPU인 G80GPU를 공동 개발했습니다. 둘 사이의 협력은 오래 가지 못하며, CUDA의 연구 개발 결정에는 엔비디아가 장기적으로 많은 돈을 투자해야 합니다.

제품 특성 측면에서 하드웨어 제품에 CUDA 논리 회로를 추가하면 칩의 방열 요구 사항이 높아져 비용 상승과 결함 증가의 위험도 높아집니다.

재무보고 실적을 보면 CUDA 역시 적자 사업인 것으로 나타났는데, 이는 2008년 금융 위기 전후에 더욱 분명해졌습니다.

가장 어려운 시기에도 Huang Renxun은 2012년 Hinton 교수가 팀을 이끌고 CPU 대신 GPU를 사용하여 AI 모델을 훈련하고 AlexNet을 만들 때까지 CUDA를 중단하지 않았습니다.

2020년 Huang Renxun은 Barron's Weekly와의 인터뷰에서 "NVIDIA가 인공 지능의 차세대 폭발을 주도할 것"이라고 강조했습니다.

지난 5년 동안 엔비디아는 인공지능을 환영하기 위해 세 가지 일을 해왔습니다.

먼저, 2019년 3월 엔비디아는 고성능 컴퓨팅 인터커넥트 기술 회사인 멜라녹스(Mellanox)를 69억 달러에 인수했습니다. 회사의 주요 제품인 InfiniBand는 더 빠르고, 더 높은 대역폭을 가지며, 데이터를 전송하는 효과적인 방법으로 간주되며, Mellanox는 InfiniBand 사양을 제공하는 유일한 공급업체입니다.

둘째, NVIDIA는 대규모 GPU 클러스터 조정을 위해 특별히 설계되었으며 NVIDIA의 완전히 통합된 솔루션인 차세대 AI 칩 "DriveThor"를 2022년 9월에 출시할 예정입니다.

셋째, NVIDIA는 가속 컴퓨팅 및 생성 AI를 위해 특별히 설계된 Hopper 아키텍처를 출시했습니다. H100은 이 아키텍처를 기반으로 하는 GPU입니다. 시장 소식통에 따르면 H100은 이윤폭이 최대 1,000%에 달하고 출하량은 900톤이 넘는 엔비디아의 제품이다.

ChatGPT 출시로 AI 서버 출하량과 가격이 올랐고, 엔비디아의 GPU 칩 가격도 급등했다. NVIDIA의 DGXH100의 총 가격은 8GPU+4NVSwitch 기판 등을 포함하여 US$268,495이며, 총 이익 마진은 단위당 US$190,000에 가깝습니다.

NVIDIA의 재정적 수익은 인상적입니다. 지난 3회계연도 연평균성장률(CAGR)은 35.2%에 달했으며, 2023년에는 매출이 51.4% 급증해 408억 달러에 달할 것으로 예상된다.

CUDA가 구축한 장벽을 무너뜨릴 수 있습니까?

2016년에 AMD는 NVIDIA의 CUDA 시스템과 유사한 오픈 소스 프로젝트 기반 GPU 생태계인 ROCm을 출시했습니다. 하지만 ROCm 기술은 뒤처져 2023년 4월에야 윈도우 플랫폼에 출시될 예정이다. 진입 시기가 늦어 AMD 개발자 수가 엔비디아에 비해 훨씬 적다. Github에는 CUDA 패키지 저장소에 기여하는 개발자가 32,600명이 넘는 반면 ROCm은 600명 미만입니다.

엔비디아는 전 세계 GPU 시장 점유율의 약 80%를 점유하고 있으며, 판매량 측면에서도 유일하다.

NVIDIA의 독점 시장 우위는 얼마나 오래 지속될 수 있습니까?

이 문제에 대해 SemiAnalytic의 수석 분석가 Dylan Patel은 다음과 같이 의견을 제시했습니다. PyTorch가 더 많은 GPU 제조업체를 지원하고 OpenAI의 Triton이 상황을 방해함에 따라 NVIDIA의 날카로운 도구인 CUDA는 점차 우위를 잃고 있습니다.

소프트웨어 생태계 관점에서 볼 때 CUDA의 지배력은 실제로 모든 당사자로부터 공격을 받고 있습니다.

최근 몇 년 동안 AI 개발 프레임워크인 PyTorch는 유연한 Eager 모드 사용 비율로 인해 점차 TensorFlow를 능가했습니다. PyTorch 2.0 버전은 AMD, Intel, Tesla, Google과 같은 GPU 및 가속기를 지원하고 개선합니다.

OpenAI는 CUDA보다 조작이 덜 어려운 'CUDA의 단순화된 버전: Triton'을 직접 출시했습니다.

2023년 1분기 AMD는 ROCm 시스템이 PyTorch 2.0 프레임워크에 통합되었으며 TensorFlow 및 Caffe 딥 러닝 프레임워크도 5세대 ROCm에 합류했다고 발표했습니다. 지난 6월 출시된 차세대 데이터센터 가속 프로세서(APU) AMDMI300은 소프트웨어 측면에서 엔비디아의 CUDA 생태계와 완벽하게 호환돼 인공지능 업계에서 엔비디아의 입지에 도전할 수 있는 기회를 얻은 것으로 업계에서 평가받고 있다.

그럼에도 불구하고 컴퓨팅 성능 측면에서 NVIDIA H100의 업그레이드된 제품 DGXGH200은 대규모 AI의 주요 병목 현상을 해결하고 풍부한 자금과 고성능 요구 사항을 가진 잠재 고객에게 적합합니다. 단기적으로 CUDA 생태계는 안정적으로 유지되며 트레이닝 칩이 필요한 대부분의 사용자는 여전히 NVIDIA를 선택할 것입니다.