2024년 10월, AMD와 Intel은 업계 리더들을 모아 x86 컴퓨팅 아키텍처의 미래를 공동으로 추진하기 위해 x86 생태계 자문 그룹(x86 생태계 자문 그룹)을 공동으로 설립했습니다. EAG가 설립되었을 때 FRED, AVX10, ChkTag 및 ACE의 네 가지 핵심 기능을 발표했습니다.이제 AMD와 Intel은 "x86 표준 매트릭스 가속 아키텍처"로 알려진 이 명령어 세트를 개발자 커뮤니티에 공식적으로 홍보하는 ACE 백서를 공동으로 발표했습니다.

ACE의 핵심 목표는 간단합니다. x86 칩의 행렬 곱셈 성능을 몇 배나 향상시키는 것입니다.
행렬 곱셈은 신경망 및 대규모 언어 모델의 기본 컴퓨팅 단위입니다. AVX10과 같은 기존 SIMD 명령어 세트는 행렬 연산을 완료할 수 있지만 컴퓨팅 밀도와 확장성에는 명백한 병목 현상이 있습니다.
외부 곱 연산을 기반으로 하는 행렬 가속 메커니즘을 도입함으로써 ACE는 동일한 입력 벡터를 사용하면서 동등한 AVX10 곱셈-누산 연산의 16배에 달하는 계산 밀도를 달성합니다.
데이터 형식 지원 측면에서 ACE는 기본적으로 INT8, OCP FP8, OCP MXFP8, OCP MXINT8 및 BF16을 포함하여 AI 분야의 현재 주류 정확도 표준을 포괄합니다.
AVX10의 확장 명령어 세트로서 ACE의 소프트웨어 생태학적 적응은 이미 진행 중입니다. Deep Learning 및 HPC 기본 라이브러리, NumPy 및 SciPy와 같은 Python 과학 컴퓨팅 라이브러리, PyTorch 및 TensorFlow와 같은 주류 기계 학습 프레임워크가 모두 통합 작업을 시작했습니다.
AMD와 인텔은 백서에서 ACE의 디자인 컨셉이 낮은 마찰과 넓은 커버리지임을 강조했습니다. 노트북에서 슈퍼컴퓨터에 이르기까지 개발자는 다양한 하드웨어 플랫폼에 맞게 코드를 다시 작성할 필요가 없습니다.
이는 AI 컴퓨팅을 전용 가속기로 마이그레이션하는 솔루션과 뚜렷한 대조를 이루며, 여기에는 종종 추가 코드 적응 및 마이그레이션 비용이 필요합니다.
