ElevenLabs, 99개 언어 지원하는 AI 음성인식 변환 기술 ‘Scribe’ 출시

AI 음성인식 변환 기술 분야에 새로운 강자가 등장했다. 최근 1억 8천만 달러의 대규모 투자를 유치한 AI 스타트업 ElevenLabs가 자체 개발한 음성-텍스트 변환 모델 ‘Scribe’를 출시했다. 기존 음성 생성 기술로 유명했던 ElevenLabs는 이번 출시로 AI 음성인식 시장에 본격 진출을 알렸다.

주요 특징과 성능

Scribe는 출시와 동시에 99개 이상의 언어를 지원하며, 25개 이상의 언어에서 5% 미만의 낮은 오류율을 기록했다. 영어의 경우 97%의 정확도를 보여주며, 프랑스어, 독일어, 힌디어, 일본어 등 주요 언어들에서도 뛰어난 성능을 입증했다. 특히 구글 Gemini 2.0 FlashWhisper Large V3 모델과의 벤치마크 테스트에서 우수한 성적을 거두었다.

기술적 특징

이 모델은 화자 구분, 단어 단위 타임스탬프, 자동 음향 이벤트 태깅 등 고급 기능을 제공한다. 현재는 사전 녹음된 오디오만 지원하지만, 곧 실시간 변환 기능도 추가될 예정이다. 시간당 0.40달러의 경쟁력 있는 가격으로 서비스를 제공한다.

AI 음성인식 변환 기술에 대한 전문가 인사이트

AI 음성인식 기술은 최근 급격한 발전을 이루고 있다. 특히 다국어 지원과 정확도 향상은 글로벌 커뮤니케이션의 새로운 지평을 열고 있다. MIT 음성인식 연구소의 최신 보고서에 따르면, 2024년 AI 음성인식 시장은 연간 35% 성장률을 기록하며, 2025년에는 150억 달러 규모로 성장할 것으로 전망된다.

음성인식 기술의 발전은 교육, 의료, 비즈니스 등 다양한 분야에서 혁신을 가져오고 있다. 특히 실시간 번역과 자막 생성 분야에서 큰 진전을 보이고 있으며, 장애인 접근성 향상에도 크게 기여하고 있다. 향후 메타버스AI 음성 비서 시장의 성장과 함께 더욱 중요해질 것으로 예상된다.

참고문헌

키워드: AI 음성인식 변환 기술, ElevenLabs, Scribe, 음성인식, 자동 음성 변환, 인공지능


AI.pocket에서 더 알아보기

구독을 신청하면 최신 게시물을 이메일로 받아볼 수 있습니다.

좋아할 만한 기사

인기 글




AI.pocket에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기

AI.pocket 트렌드 레이더

지금 구독하여 인스타 피드보다 48시간 빠른 뉴스레터를 받아보세요.

계속 읽기