|
8일 엔씨에 따르면 TTS(Text to Speech)는 자연어를 입력해 캐릭터 목소리 같은 음성 콘텐츠를 제작하는 음성 합성 기술이다. 엔씨(NC)가 공개한 '멀티버스 TTS'는 3초 분량의 프롬프트 음성만으로도 △다양한 발화 스타일 변환 △화자 음색 일치도가 높은 교차 언어 생성 △다국어 음성 제작이 가능하다.
엔씨는 '멀티버스 TTS' 기술을 게임 음성 제작 과정 전반에 활용할 계획이다.
TTS는 단일 모델로 구동이 가능하다는 특징이 있다. '멀티버스 TTS'는 여러가지 언어와 기능을 가진 TTS를하나의 모델로 제공해 다국어 음성 콘텐츠를 제작한다. 최적화된 하나의 모델을 활용하는 만큼 경쟁 TTS 모델에 비해 상대적으로 적은 운용 비용으로 고품질의 음성 생성 서비스를 제공한다.
뿐만 아니라 엔씨는 단일 모델로 다양한 스타일의 언어와 음성을 생성하는 '멀티버스 TTS' 모델 논문을 세계적인 권위를 갖는 인공지능 관련기술 학회 'EMNLP'에 게재하기도 했다.