IBM은 엄청난 양의 에너지를 절약하면서 빛의 속도로 AI 모델을 훈련할 수 있는 새로운 광학 기술을 개발했습니다. 회사 측은 자사의 획기적인 기술을 데이터센터에 적용해 AI 모델 훈련 시 미국 5000가구의 연간 에너지 사용량에 해당하는 에너지를 절약할 수 있다고 밝혔다.
회사 측은 데이터센터가 광섬유 케이블을 통해 외부와 연결되어 있지만 내부적으로는 여전히 구리선을 사용하고 있다고 설명했다. 이 전선은 다른 장치의 데이터를 기다리는 동안 많은 시간을 유휴 상태로 보내 에너지를 소비하고 비용을 증가시키는 GPU 가속기를 연결합니다.
IBM의 수석 부사장 겸 연구 이사인 Dario Gil은 개발에 대해 다음과 같이 말했습니다.
"AI를 생성하려면 더 많은 에너지와 처리 능력이 필요하기 때문에 데이터 센터는 계속 발전해야 하며 공동 패키지 광학 장치는 이러한 데이터 센터의 미래를 보장할 수 있습니다. 이 혁신을 통해 미래의 칩은 데이터 센터 안팎으로 데이터를 전달하는 광섬유 케이블처럼 통신하여 미래의 AI 워크로드를 처리할 수 있는 더 빠르고 지속 가능한 통신의 새로운 시대를 열게 될 것입니다."
IBM은 기술 문서에서 새로운 CPO(공동 패키지 광학) 프로토타입을 설명했습니다. 데이터 센터 대역폭을 크게 늘리면 GPU 가동 중지 시간이 최소화되어 AI 처리가 가속화됩니다.
IBM은 LLM(대형 언어 모델) 훈련 시간을 3개월에서 3주로 단축할 수 있다고 설명합니다. 동시에 에너지 효율성을 개선하면 에너지 사용량이 줄어들고 LLM 교육과 관련된 비용이 낮아집니다.