네오사피엔스, 정교한 감정표현 음성합성 AI기술 공개

인공지능 스타트업 네오사피엔스가 인간 성우를 대신해 콘텐츠 더빙을 할 수 있는 정교한 감정표현 음성합성 기술을 공개한다.

 
오는 28~29일 개최하는 네이버 개발자 컨퍼런스 ‘데뷰(DEVIEW)’에서 자사의 원천기술로 개발한 감정표현 음성합성 기술에 대한 “다양한 감정연기와 외국어 가능한 인공지능 성우” 주제로 발표할 예정이다.
 
▲네오사피엔스 인공지능 성우 서비스 TypeCast(타입캐스트)를 IT NEWS 컨텐츠에 적용하는 모습.
이미 네오사피엔스는 대교와 전략적인 제휴를 맺고 오디오북을 제작하여 판매하고 있으며, MBC와 협업하여 백범 김구 선생 음성을 복원하는 등, 다양한 사업을 전개하고 있다. 
 
또한, 누구나 인공지능 성우 서비스를 사용할 수 있도록 온라인 서비스 “타입캐스트(typecast)”를 11월 1일부터 정식 서비스를 시작한다.
 
네오사피엔스는 인공지능 음성분야에서 선도적인 연구 결과를 내고 있다. 현재 다수 국내외 특허를 포함하여 NeuIPS(국제 신경 정보 처리 학회), ICASSP(국제 음향 음성 신호처리 학회), Interspeech(국제 음성 학회) 등 관련 분야 세계 최고 학회지에 다수의 논문을 발표하고 있다.
 
또한 최근에는 네오사피엔스 기술력과 논문들이 구글, 페이스북, 아마존 등에서 발표한 논문에서도 필수로 인용하는 논문이 될 만큼 기술력을 인정받고 있다.
 
네오사피엔스는 “감정연기와 외국어가 가능한 인공지능 성우 연구개발은 대부분 음성합성 기술들이 프로그램으로 만들어낸 듯 감정적인 요소가 없어 실제 사용자들이 불편함을 느꼈기 때문”이라고 밝혔다.
 
네오사피엔스는 인공지능 성우 서비스 TypeCast(타입캐스트)를 올해 초 부터 공개하면서 오픈 베타를 진행해왔다. 오는 28일(월)부터 정식 서비스를 오픈할 예정이다.
 
타입캐스트는 기자, 작가, 블로거, 영상 컨텐츠 제작자 등 전문 성우나 아나운서가 필요한  경우 누구나 손쉽게 오디오 컨텐츠를 생성할 수 있는 서비스다. 현재 다양한 사용자들이 영상과 오디오 컨텐츠를 제작하는데 활용하고 있다.
네오사피엔스는 앞으로 감정과 음성 스타일을 조절하는 서비스를 고도화하는 동시에 다양한 언어를 지원해 글로벌 서비스로 확장할 계획이다.
 
네오사피엔스는 퀄컴(Qualcomm)과 카이스트(KAIST) 출신의 음성 분야 인공지능 전문가들이 뭉쳐 2017년 11월에 설립한 인공지능 스타트업이다.
 
사람처럼 말할 수 있는 인공지능 음성 기술을 보유하고 있으며, 지난해 Seed투자에 이어 Pre-시리즈 A까지 총 12억원 투자를 유치했다. 최근에는 다양한 감정 연기가 되는 음성 합성 기술을 선보이기도 하였고, 관련 특허를 다수 출원하고, 인공지능을 통한 미디어, 엔터테인먼트 분야의 혁신을 주도하고 있다.
 
김한비 기자 itnews@