오늘 아침 9시에 DeepSeek은 오픈 소스 주간 약속을 계속 이행하고 오픈 소스를 출시했습니다.DeepGEMM. 이 게시물이 전달되자 즉시 관심을 끌었습니다.21,000그 독서량은 국내외에서 그 인기를 입증하기에 충분하다. DeepGEMM은 다음에 초점을 맞춘 프로젝트인 것으로 이해됩니다.FP8효율적인 일반 행렬 곱셈(GEMM) 라이브러리는 일반 및 혼합 전문가(MoE) 그룹의 행렬 컴퓨팅 요구 사항을 지원하고 리소스 할당을 동적으로 최적화하여 컴퓨팅 성능 효율성을 향상시킬 수 있습니다.
이 라이브러리는 다음을 기반으로 합니다.쿠다개발하다, 채택하다경량 JIT(Just-In-Time 컴파일) 모듈, 사전 컴파일 및 설치 없이 런타임에 커널을 동적으로 컴파일합니다.
DeepGEMM이 다음과 같이 설계되었다는 점은 언급할 가치가 있습니다.DeepSeek-V3/R1 모델특히 교육 및 추론을 위한 간단하고 효율적인 기본 지원을 제공합니다.호퍼 아키텍처 GPU(예: H800) 최적화, 고성능과 저렴한 비용을 고려합니다.
오픈 소스 주간의 세 번째 결과인 DeepGEMM의 출시는 DeepSeek의 이전 오픈 소스 모델 및 도구(예: FlashMLA) 전략을 이어가며 고성능 컴퓨팅 기술의 적용 임계값을 더욱 낮춥니다.
또한, 이번 오픈소스는 앞서 공개된 DeepSeek의 '오픈소스 주간'(2월 24~28일)의 세 번째 프로젝트다.FlashMLA(효율적인 디코딩 커널) 및 DeepEP(전문 병렬 통신 라이브러리).