오늘 Volcano Engine은 FORCE Power Conference에서 Bean Bag 모델 1.8과 오디오 및 비디오 제작 모델인 Seedance 1.5 pro를 공식 출시했습니다. 권위 있는 평가 데이터에 따르면 Doubao Big Model은 다중 모드 이해, 생성 기능 및 에이전트 기능 측면에서 세계 1위를 차지했습니다.
Volcano Engine 사장 Tan Dai에 따르면, 올해 12월 현재 Doubao Big Model의 일일 평균 토큰 사용량은 50조를 초과했으며 이는 작년 같은 기간에 비해 10배 이상 증가한 수치입니다. 현재 100개 이상의 기업 고객이 1조 이상의 토큰 사용량을 보유하고 있습니다.
Doubao 제품군의 최신 주력 모델인 Doubao 대형 모델 1.8(Doubao-Seed-1.8)은 다중 모드 에이전트 시나리오에 최적화되었습니다. 도구 호출 기능, 복잡한 지시 따르기 기능 및 OS 에이전트 기능이 모두 향상되어 복잡한 작업을 처리할 때 모델의 계획 및 실행 수준이 향상되었습니다.
시각적 이해 측면에서 Doubao 1.8의 단일 비디오 이해 프레임 수는 640프레임에서 1280프레임으로 두 배 증가했습니다. 이 모델은 낮은 프레임 속도에서 매우 긴 비디오를 이해할 수 있도록 지원하며 높은 프레임 속도에서 주요 세그먼트를 이해하는 도구를 호출할 수 있습니다. 이 기능은 온라인 교육, 제품 품질 검사 및 기타 시나리오에서 널리 사용될 수 있습니다.
비디오 제작에 대한 수요 증가에 대응하여 Volcano Engine은 Seedance 1.5 pro 오디오 및 비디오 제작 모델을 출시했습니다. 이 모델은 영화나 TV 수준의 서사적 긴장감을 가질 뿐만 아니라 모션 디테일을 정확하게 포착하고 캐릭터의 감정을 섬세하게 표현할 수 있을 뿐만 아니라 오디오 및 비디오 동기화 기술에서도 획기적인 발전을 이루었습니다.
Seedance 1.5 pro는 혁신적인 기본 오디오 및 비디오 공동 생성 아키텍처를 채택하고 환경 사운드, 배경 음악, 보컬 및 기타 요소를 지원하며 밀리초 수준의 오디오 및 비디오 동기 출력을 달성합니다. 대화 처리 측면에서 이 모델은 중국어 방언(예: 사천 방언, 광둥어 등), 영어 및 소수 언어를 포함하여 정확한 입 정렬을 통해 다중 사용자 및 다중 언어 대화를 지원하여 비디오 콘텐츠의 사실성과 글로벌 생성 잠재력을 크게 향상시킵니다.
생성 임계값과 비용을 더욱 줄이기 위해 Seedance 시리즈는 곧 "초안 샘플" 기능을 출시할 예정입니다. 제작자는 먼저 미리보기용 저해상도 샘플을 생성할 수 있으며, 그 핵심 요소는 최종 영화와 매우 일치하므로 실제로 "미리보기가 바로 당신이 얻을 수 있는 것"입니다. 데이터에 따르면 이 기능은 창작자의 전반적인 효율성을 65% 향상시키고 비효율적인 창작 비용을 60% 줄이는 데 도움이 될 수 있습니다.
현재 개인 사용자는 Doubao, Jimeng AI 및 기타 플랫폼에서 모델을 경험할 수 있습니다. 기업 사용자는 12월 23일부터 Volcano Engine API를 통해 Seedance 1.5 pro 모델 서비스에 액세스할 수 있습니다.
Tan Dai는 기존 IT 아키텍처로는 더 이상 에이전트 시대의 요구 사항을 충족할 수 없다고 지적했습니다. 모델 중심의 AI 클라우드 네이티브 아키텍처가 구체화되고 있으며 에이전트 개발 및 운영을 중심으로 재구성되고 있습니다.
에이전트 개발 수준에서 Volcano Engine은 엔터프라이즈 수준의 AI 에이전트 플랫폼 AgentKit을 포괄적으로 업그레이드했습니다. 이 플랫폼은 개발, 배포부터 관리 및 제어에 이르기까지 에이전트의 전체 수명 주기를 다루며, 신원 권한 관리, 모델 확실성 및 시스템 통합과 같은 에이전트 구현 시 기업이 직면한 핵심 과제를 해결하는 것을 목표로 합니다.
또한 볼케이노엔진은 기업 이용 문턱을 낮추기 위해 업계 최초로 'AI 절감 플랜'을 출시했다. 이 요금제는 종량제 가격이 필요한 모든 대형 모델 제품에 적용되며, 계층형 할인을 통해 기업이 최대 47%의 비용을 절감할 수 있도록 도와줍니다.
