이번 주 Microsoft Edge 브라우저의 AICopilot에는 비디오 텍스트 요약을 생성하는 기능이 추가되었습니다. 그러나 Microsoft Advertising and Network Services의 CEO인 Mikhail Parakhin이 설명했듯이 EdgeCopilot의 시간 절약 기능은 여전히 ​​상당히 제한적이며 사전 처리된 비디오나 자막이 있는 비디오에서만 작동합니다.

"작동하려면 비디오를 전처리해야 합니다. 비디오에 자막이 있으면 언제든지 복원할 수 있습니다. 자막이 없고 전처리하지 않으면 작동하지 않습니다."라고 Parakhin은 썼습니다.

즉, EdgeCopilot 자체는 요약 영상이라기보다는 영상을 요약한 대본입니다. Copilot은 Teams 화상 회의 및 고객 서비스 상담원 통화 요약을 포함하여 Microsoft 365에서 유사한 기능을 수행할 수도 있습니다. 두 경우 모두 먼저 Microsoft에서 오디오를 기록해야 합니다. Microsoft Stream의 Copilot은 모든 비디오를 요약할 수도 있지만 사용자가 서면 대본을 생성해야 합니다.

대화는 디자이너 Pietro Schirano가 GTAVI 예고편의 YouTube 동영상을 요약한 EdgeCopilot의 화면 녹화를 게시한 후 시작되었습니다. 이번 경우에는 Copilot이 그 일을 완벽하게 해낸 것 같습니다. 녹화 중인 사용자가 Copilot의 사이드바에 있는 "비디오 요약 생성" 버튼을 누르면 불과 몇 초 후에 Copilot이 핵심 포인트와 타임스탬프가 포함된 비디오 요약을 생성합니다.

물론 YouTube, Vimeo를 포함한 많은 플랫폼에서는 사용자가 이 기능을 활성화한 경우 자동으로 대본과 자막을 생성할 수 있습니다. TheVerge가 Parakhin에게 물었습니다.

Copilot은 생성 AI 생성 경쟁에서 Microsoft가 Google(및 기타 업체)을 상대한 최신 사례일 뿐입니다. 지난 달 Google은 비디오 콘텐츠를 요약하고 특정 정보를 표시할 수 있는 YouTube 확장 프로그램으로 Bard 챗봇을 업그레이드했습니다. 이번 주에 Google은 Gemini에 대한 주요 업데이트를 발표했지만 업데이트 자체에는 문제가 있습니다. 한 프레젠테이션에서 회사의 편집자는 AI의 일부 기능을 잘못 표현했을 수 있으며 Google이 항상 사실을 정확하게 파악하지는 않습니다.

Parashin은 Copilot의 다양한 개발 단계에 대해 소셜 미디어에서 솔직하게 말했습니다.