Microsoft: Phi-2 모델은 경쟁사보다 성능이 뛰어나며 devices

마이크로소프트는 화요일 자사의 인공지능 모델인 Phi-2가 메타(MTEA)와 같은 다른 회사의 경쟁 제품보다 성능이 뛰어나며 장치에서 실행될 수 있다고 밝혔습니다. 마이크로소프트는 블로그를 통해 "Phi-2 모델의 매개변수는 27억개에 불과하지만 각종 종합 벤치마크 테스트에서 70억개 매개변수를 보유한 유럽 AI 스타트업 미스트랄(Mistral)의 대형 언어 모델(LLM) 미스트랄7B(Mistral7B)와 메타(Meta)가 출시한 130억개 매개변수를 갖춘 AI 모델 라마2(Llama2)를 능가하는 성능을 보였다"고 밝혔다.

"특히 Phi-2 모델은 다단계 추론 작업(예: 코딩 및 수학)에서 700억 매개변수의 Llama2보다 성능이 뛰어났습니다(Llama2 모델 제품군에는 70억, 130억, 700억 매개변수의 세 가지 매개변수 변형이 포함되어 있습니다)."

마이크로소프트는 “또한 Phi-2 모델의 성능은 더 작은 모델 크기에도 불구하고 최근 출시된 구글 제미니 나노2(Google Gemini Nano2)와 비슷하거나 그보다 낫다”고 덧붙였다. 마이크로소프트는 Phi-2 모델이 Azure Studio에서 출시될 것이라고 밝혔습니다.

마이크로소프트는 올해 6월 매개변수가 13억개에 불과한 Phi-1 모델을 출시한 것으로 알려졌다. 이는 QA Q&A, 채팅 형식, 코드 등의 시나리오에 적합하다. 이 모델은 전적으로 고품질 데이터를 사용하여 학습되었으며 벤치마크 테스트에서 유사한 모델보다 최대 10배 더 나은 성능을 발휘합니다.

마이크로소프트는 올해 9월 Phi-1.5 버전을 업데이트해 출시했다. 이 버전에도 13억 개의 매개변수가 있고 시, 이메일, 이야기를 쓰고 텍스트를 요약할 수 있다. 상식, 언어 이해 및 추론의 벤치마크에서 이 모델은 일부 영역에서 최대 100억 개의 매개변수를 사용하는 모델을 따라잡을 수 있었습니다.

마이크로소프트가 지난 11월 업데이트를 통해 공개한 Phi-2의 규모는 이전 버전에 비해 두 배로 늘어났지만, 여전히 다른 주류 언어 모델에 비하면 훨씬 작다. Microsoft는 Phi-2가 논리적 추론과 보안이 크게 향상되었으며 올바른 미세 조정과 사용자 정의를 통해 작은 언어 모델이 클라우드 및 엣지 애플리케이션을 위한 강력한 도구라고 말합니다.