2026 빌드 개발자 컨퍼런스에서 Microsoft는 Microsoft AI Superintelligence 팀이 만든 자체 개발 MAI 모델 제품군의 대폭 확장을 발표하여 최초의 범용 추론 모델 MAI-Thinking-1, GitHub Copilot용 코드 모델 MAI-Code-1, 그리고 엔드투엔드 AI 기술 환경을 더욱 개선하기 위한 음성, 전사 및 이미지 생성 모델의 여러 업데이트 버전을 출시했습니다. 이는 음성 및 이미지에서 복잡한 추론 및 개발자 생산성 시나리오에 이르기까지 기본 모델 분야에서 Microsoft의 가속화된 확장을 의미합니다.

마이크로소프트는 지난 1년 동안 MAI 모델 제품군이 지속적으로 확장되어 올해 초 MAI-Voice-1, MAI-1-preview, MAI-Transcribe-1 및 MAI-Image-2를 출시한 데 이어 텍스트 렌더링, 스타일화된 일러스트레이션 및 상업용 이미지의 품질이 향상된 MAI-Image-2.5를 출시했다고 밝혔습니다. 이번에는 이를 기반으로 새로운 추론 및 코딩 모델을 추가하고 음성, 전사, 이미지 제품군을 동시에 업그레이드해 더욱 완벽한 제품 포트폴리오를 구성했다.

MAI-Thinking-1은 Microsoft가 공식적으로 발표한 최초의 추론 모델입니다. Microsoft AI 팀에 의해 처음부터 훈련되었으며 다른 모델에서 추출되지 않았습니다. Microsoft는 이 모델이 상업적으로 라이선스가 부여된 깨끗한 엔터프라이즈 수준 데이터를 사용하여 교육되었으며 데이터 규정 준수 및 상용화에 대한 엔터프라이즈 사용자의 요구 사항을 충족하도록 설계되었다고 강조했습니다. MAI-Thinking-1은 350억 개의 활성화 매개변수를 갖춘 중간 규모 모델이며 128K 컨텍스트 창을 지원합니다. 주로 복잡한 다단계 명령 실행, 긴 컨텍스트 추론 및 코드 생성과 같은 시나리오를 대상으로 합니다.

마이크로소프트는 이번 발표에서 자세한 벤치마크 데이터를 공개하지는 않았지만 자사 블로그에서 독립적인 리뷰 결과를 인용하며 블라인드 테스트에서 리뷰어들의 전반적인 선호도는 앤트로픽(Anthropic)의 클로드 소네트 4.6(Claude Sonnet 4.6)보다 MAI-Thinking-1에 더 가깝다고 밝혔다. 또한 Microsoft는 SWE-bench Pro 코드 작업 테스트에서 MAI-Thinking-1이 코딩 성능 면에서 Claude Opus 4.6과 유사하다고 밝혔으며, 이는 개발자 및 복잡한 엔지니어링 작업을 위한 이 모델의 잠재력을 보여줍니다. MAI-Thinking-1은 현재 Microsoft Foundry를 통해 일부 고객을 위한 비공개 미리 보기로 제공됩니다.

이미지 생성 측면에서 Microsoft가 이전에 출시한 MAI-Image-2.5와 "플래시 변형"은 Microsoft Foundry를 통해 개발자에게 공개되었습니다. Microsoft가 인용한 Arena의 최신 기사 목록 데이터에 따르면 MAI-Image-2.5는 텍스트 이미지 생성 작업에서 Google의 Nano Banana Pro를 능가하여 목록 상위 3위에 진입했습니다. 이 모델은 PowerPoint에 통합되었으며 점차적으로 OneDrive로 출시되어 Office 생태계에 더 높은 품질의 이미지 생성 기능을 제공합니다.

음성 전사 측면에서 마이크로소프트는 올해 4월 자체 제품 사용 데이터를 기반으로 가장 일반적으로 사용되는 25개 언어의 음성-텍스트 전사를 지원하는 MAI-Transcribe-1을 출시했습니다. 이번에 Microsoft는 음성 인식 정확도에서 업계 최고의 수준에 도달하고 지원되는 언어 수를 43개로 확장한 업그레이드 버전 MAI-Transcribe-1.5를 출시했습니다. 실시간 시나리오의 요구 사항을 충족하기 위해 곧 모델에 스트리밍 전사 기능을 추가할 계획입니다.

음성 합성 분야에서는 마이크로소프트가 올해 4월 MAI-Voice-1을 정식 출시했다고 발표한 데 이어 이번에 MAI-Voice-2와 라이트닝 버전을 출시했다. 차세대 음성 생성 모델은 15개 이상의 추가 언어를 지원하고 다국어 고객 서비스, 콘텐츠 더빙, 스마트 어시스턴트 등 더욱 풍부한 애플리케이션 시나리오에 적응할 수 있는 더 많은 음성 스타일 옵션을 제공합니다.

개발자의 코딩 시나리오를 위해 Microsoft는 GitHub 워크로드에 최적화된 효율적인 추론 코드 모델인 MAI-Code-1을 동시에 출시했습니다. 이 모델은 GitHub Copilot 및 Visual Studio Code에서 출시되어 일상적인 코딩, 리팩터링, 코드 완성 및 기타 시나리오를 지원합니다. Microsoft는 MAI-Code-1의 구체적인 벤치마크 결과를 공개하지 않았지만 이번 릴리스는 중요한 신호로 간주됩니다. Microsoft는 더 이상 GitHub Copilot의 기본 모델에 대해 OpenAI 및 Anthropic에 전적으로 의존하지 않고 점차 자체 개발 모델을 도입합니다.

유통 채널 측면에서 마이크로소프트는 마이크로소프트 파운드리를 통해 기업과 개발자에게 서비스를 제공하는 것 외에도 자사의 MAI 시리즈 모델이 파이어웍스 AI(Fireworks AI), 베이스텐(Baseten), 오픈라우터(OpenRouter) 등 타사 플랫폼에서도 출시될 것이라고 발표했다. 동시에 Fireworks AI는 Microsoft Foundry 내에서도 일반 공급되어 기업 고객에게 더 많은 아키텍처 및 배포 옵션을 제공합니다. Microsoft는 여러 플랫폼과 협력함으로써 액세스 임계값을 더욱 낮추고 다양한 클라우드 및 도구 생태계에서 MAI 모델 구현을 가속화하기를 희망합니다.

전체 레이아웃에서 Microsoft는 MAI 추론, 코딩, 음성, 전사 및 이미지와 같은 여러 유형의 모델을 사용하여 완전한 엔터프라이즈 수준의 AI 기능 매트릭스를 구축하고 있습니다. MAI-Thinking-1 및 MAI-Code-1의 추가로 복잡한 추론 및 개발자 생산성 분야에서 Microsoft의 목소리가 크게 향상되었으며 GitHub Copilot, Office 시리즈 및 협업 플랫폼에 더욱 경쟁력 있는 기술 기반을 제공했습니다.