화웨이의 차세대 Ascend 950 AI 가속기의 물리적 이미지가 처음으로 공개되었으며, 자체 개발한 칩과 자체 개발한 고대역폭 메모리(HBM)의 패키징 형태를 보여줍니다. 이 칩은 화웨이가 자체 개발한 1세대 HBM과 차세대 AI 가속 장치를 동일한 패키지에 통합합니다. 단일 칩 성능 측면에서 Nvidia와 같은 "하드코어" 경쟁업체가 아닌 대규모 컴퓨팅 클러스터에 적합하며 시스템 규모와 클러스터 밀도를 통해 경쟁합니다.
Huawei는 이전에 Ascend 950 시리즈가 2026년 초에 공식 출시될 예정이며 최소 두 가지 모델을 포함할 것이라고 발표했습니다.

보고서에 따르면 Ascend 950 시리즈 중 950PR 버전은 약 1.6TB/s의 대역폭으로 Huawei가 자체 개발한 128GB HBM을 통합합니다. 950DT 버전은 용량을 144GB로 늘리고 대역폭을 거의 4TB/s로 크게 늘립니다. 두 칩의 컴퓨팅 성능 목표는 단일 카드에 대해 1 PetaFLOPS 수준 FP8 성능과 2 PetaFLOPS 수준 FP4 성능이며 현재 주류 대형 모델 추론 및 교육 시나리오를 대상으로 합니다. 화웨이의 전반적인 전략은 고밀도 패키징과 효율적인 상호 연결 네트워크에 더 중점을 두고 있으며, 캐비닛과 데이터 센터 수준에서 컴퓨팅 성능과 상호 연결 효율성을 개선하여 단일 칩 성능의 격차를 상쇄합니다.
제조 공정 측면에서는 현재 공식적으로 확인된 공정 노드 정보가 없다고 기사는 지적하고 있지만, 업계에서는 일반적으로 Ascend 950이 5nm 노드로 분류되는 SMIC의 최신 N+3 공정을 사용할 가능성이 높을 것으로 예상하고 있습니다. SMIC는 이전에 자사의 N+3 노드가 EUV 장비에 의존하지 않고 대량 생산을 달성했다고 발표했으며, 첫 번째 공개 고객은 Kirin 9030 SoC가 탑재된 화웨이의 단말기 제품입니다. 이러한 맥락에서 화웨이의 전략적 AI 가속 제품인 Ascend 950이 동일한 노드를 사용한다는 것은 '자연스러운' 추론으로 간주됩니다.
실제 사진에서 Ascend 950은 멀티 칩 패키징 디자인을 채택했습니다. 코어는 2개의 컴퓨팅 칩 다이이며, 의심되는 2개의 추가 I/O 및 네트워크 관련 칩 다이와 쌍을 이루어 멀티 칩 모듈(MCM)을 형성합니다. 이러한 I/O 및 네트워크 칩은 가속기 카드를 더 큰 SuperPoD 및 SuperCluster 클러스터에 연결하고 차세대 "Lingqu" 상호 연결 프로토콜 및 광학 상호 연결 기술을 통해 수십만 개의 Ascend 950 카드의 고대역폭 상호 연결을 달성하는 역할을 하는 것으로 알려져 있습니다. 'LPDDR/HBM 하이브리드 형태'와 유사하게 다이 주위에 링형 패키징 구조가 분산된 모듈은 화웨이가 자체 개발한 HBM 패키지인 것으로 추측됩니다. 이는 독립 패키지로 생산된 다음 시스템 수준 패키지의 가속기 기판에 적층 및 통합될 가능성이 높습니다.
전반적으로 Ascend 950의 설계 경로는 NVIDIA Blackwell과 같은 고급 GPU와 일부 유사합니다. 둘 다 듀얼 칩 패키징을 사용하여 단일 카드에 더 많은 컴퓨팅 성능을 추가하고 고대역폭 HBM 및 전용 상호 연결 프로토콜을 사용하여 대규모 컴퓨팅 클러스터를 구축합니다. 차이점은 화웨이가 현 단계에서 '규모별 승리'라는 아이디어에 더 초점을 맞추고 있으며, 밀도 높은 패키징, 멀티 카드 상호 연결 및 슈퍼 클러스터 솔루션을 통해 데이터 센터 및 AI 클라우드 컴퓨팅 파워 시장에서 대체 솔루션을 형성하는 동시에 로컬 공급망의 독립적인 제어 가능성을 강화하기를 희망하고 있다는 것입니다.