DeepSeek의 하드웨어 시설은 세부 사항을 공개하지 않았지만 일반적으로 H100, H800, H20 및 기타 다른 모델을 포함하여 다수의 NVIDIA AI 칩이 사용되는 것으로 알려져 있습니다. 그러나 최근 노출에 따르면 DeepSeek은 Huawei의 최신 AI 칩인 Ascend 910C도 확인했습니다.

어센드 910C는 2024년 후반에 공개됐다. 알리바바, 바이두, 텐센트 등 일부 고객사에 일괄 공급됐다고 한다. 첫 번째 배치는 약 70,000개이며 평균 가격은 각각 약 20,000위안입니다.

메시지는 다음과 같습니다.Ascend 910C는 듀얼 칩 통합 패키징과 함께 SMIC의 7nm 공정을 사용하여 제조됩니다. 트랜지스터 수는 530억개에 달하고 전체 국산화율은 약 55%에 달한다.

NVIDIA H100을 대체할 수 있으며 대규모 AI 훈련 및 추론에도 사용됩니다. FP8, FP16, FP32 및 FP64와 같은 다양한 데이터 유형에서 잘 작동합니다.

910C를 오르다

최근 발표에 따르면,DeepSeek 팀의 측정 데이터에 따르면 Huawei의 Ascend 910C는 AI 추론에서 NVIDIA H100 칩의 약 60%에 달하는 예상치 못한 성능을 발휘하는 것으로 나타났습니다.

뿐만 아니라,손으로 직접 작성한 CUNN 커널과 최적화를 통해 Ascend 910C의 성능을 더욱 향상시킬 수 있습니다.

라고 한다DeepSeek은 처음부터 Huawei Ascend 칩을 지원합니다., 단 한 줄의 코드로 CUDA를 CUNN으로 변환할 수 있는 PyTorch 웨어하우스를 독립적으로 유지 관리합니다. 성능 최적화의 잠재력 또한 엄청나며, 맞춤형 최적화를 통해 더 높은 성능을 달성할 수 있습니다.

다만 현재 알려진 것은 Ascend 910CAI가 뛰어난 추론 성능을 가지고 있다는 점이지만,AI 훈련 성능은 여전히 ​​만족스럽지 않을 수 있습니다.


성텡 910