이번 주 Microsoft Edge 브라우저의 AICopilot에는 비디오 텍스트 요약을 생성하는 기능이 추가되었습니다. 그러나 Microsoft Advertising and Network Services의 CEO인 Mikhail Parakhin이 설명했듯이 EdgeCopilot의 시간 절약 기능은 여전히 상당히 제한적이며 사전 처리된 비디오나 자막이 있는 비디오에서만 작동합니다.
"작동하려면 비디오를 전처리해야 합니다. 비디오에 자막이 있으면 언제든지 복원할 수 있습니다. 자막이 없고 전처리하지 않으면 작동하지 않습니다."라고 Parakhin은 썼습니다.
즉, EdgeCopilot 자체는 요약 영상이라기보다는 영상을 요약한 대본입니다. Copilot은 Teams 화상 회의 및 고객 서비스 상담원 통화 요약을 포함하여 Microsoft 365에서 유사한 기능을 수행할 수도 있습니다. 두 경우 모두 먼저 Microsoft에서 오디오를 기록해야 합니다. Microsoft Stream의 Copilot은 모든 비디오를 요약할 수도 있지만 사용자가 서면 대본을 생성해야 합니다.
대화는 디자이너 Pietro Schirano가 GTAVI 예고편의 YouTube 동영상을 요약한 EdgeCopilot의 화면 녹화를 게시한 후 시작되었습니다. 이번 경우에는 Copilot이 그 일을 완벽하게 해낸 것 같습니다. 녹화 중인 사용자가 Copilot의 사이드바에 있는 "비디오 요약 생성" 버튼을 누르면 불과 몇 초 후에 Copilot이 핵심 포인트와 타임스탬프가 포함된 비디오 요약을 생성합니다.
물론 YouTube, Vimeo를 포함한 많은 플랫폼에서는 사용자가 이 기능을 활성화한 경우 자동으로 대본과 자막을 생성할 수 있습니다. TheVerge가 Parakhin에게 물었습니다.
Copilot은 생성 AI 생성 경쟁에서 Microsoft가 Google(및 기타 업체)을 상대한 최신 사례일 뿐입니다. 지난 달 Google은 비디오 콘텐츠를 요약하고 특정 정보를 표시할 수 있는 YouTube 확장 프로그램으로 Bard 챗봇을 업그레이드했습니다. 이번 주에 Google은 Gemini에 대한 주요 업데이트를 발표했지만 업데이트 자체에는 문제가 있습니다. 한 프레젠테이션에서 회사의 편집자는 AI의 일부 기능을 잘못 표현했을 수 있으며 Google이 항상 사실을 정확하게 파악하지는 않습니다.
Parashin은 Copilot의 다양한 개발 단계에 대해 소셜 미디어에서 솔직하게 말했습니다.