오디오 스타트업 크리스프(Krisp)는 인공지능을 사용해 통화 중에 사용자의 억양을 실시간으로 바꾸는 새로운 기능을 출시한다고 수요일 밝혔다. 회사는 처음에 인도식 영어 악센트를 미국식 영어로 변경하는 기능을 출시했습니다.

이 스타트업은 악센트 전환 과정을 통해 말하는 사람의 목소리는 보존되고 미국식 억양과 일치하도록 음소만 전환된다고 말합니다. 이 기능은 기업 환경에서 테스트된 것으로 보이며 현재 Krisp 데스크톱 앱에서 베타 버전을 사용할 수 있습니다. 사용자는 통화 중이나 통화 전에 언제든지 이 기능을 활성화할 수 있습니다.

회사의 공동 창립자인 Arto Minasyan은 대화 중에 직면한 질문에서 이 기능에 대한 아이디어가 나왔다고 말했습니다. "내가 영어를 잘해도 많은 사람들이 내 억양을 이해하지 못합니다. 우리는 억양을 바꾸면 사람들이 서로를 더 잘 이해하는 데 도움이 될 것이라고 생각했습니다. 우리는 2년 전에 이 작업을 시작했고 지금은 베타 버전을 출시하고 있습니다"라고 Minasyan은 말했습니다.

그러나 기자들이 이 기능을 테스트했을 때 처리된 음성이 부자연스럽게 들리고 때로는 일부 단어가 누락되기도 한다는 사실을 발견했습니다. 회사는 이것이 베타 버전의 결함을 비난하고 모델이 시간이 지남에 따라 개선될 것이라고 말했습니다.

Krisp은 기업을 대상으로 이 기능을 테스트했을 때 판매 전환율이 26.1% 증가했고 단위 판매가 14.8% 증가했다고 주장합니다.

회사는 인도인들이 STEM 분야의 전 세계 인력에서 큰 부분을 차지하고 있기 때문에 인도인 억양을 먼저 연구하기로 결정했다고 밝혔습니다. 그들은 필리핀 악센트를 포함하여 더 많은 악센트에 대한 지원을 추가할 계획입니다.

GV가 지원하는 Sanas와 같은 다른 스타트업도 유사한 기술을 콜센터에 대규모로 배포했습니다.

이 회사는 다양한 억양과 방언을 다루는 수천 개의 음성 샘플을 대상으로 모델을 훈련했으며 사용자 동의를 받아 회의 도우미의 데이터를 사용했다고 밝혔습니다. 이 기능의 또 다른 장점은 화자의 프로필을 실시간으로 생성하기 때문에 사용자의 음성을 사전 훈련할 필요가 없다는 점입니다.

Krisp은 2021년에 마지막으로 자금을 조달했으며, 회사는 대면 회의를 지원하기 위해 올해 iOS 및 Android 앱을 출시할 계획입니다. 또한 회사는 Google Meet과의 더 나은 통합을 위해 새로운 Chrome 확장 프로그램을 개발 중입니다.