[CTL Teaching Tips #22] 텍스트를 음성으로, 음성 생성 AI: 네이버 클로바더빙
- 교육개발센터
- 조회수645
- 2023-07-14
교육개발센터-20230714
<출처 표기방법> 이상은, 김예진, 구민영(2023). 텍스트를 음성으로, 음성 생성AI: 네이버 클로바더빙(CTL Teaching Tips #22). 서울: 성균관대학교 교육개발센터.
이번 티칭팁은 생성 AI 중 음성 생성 AI에 주목하여 다루고자 합니다. 최근 실제 사람이 아닌 AI의 목소리가 나오는 영상이 많이 만들어지고 있고 발음, 속도 및 유창성이 발전하여 거부감 없이 들을 수 있게 되었습니다. 또한 음성 생성 AI에 내 목소리를 입혀 글을 읽도록 만들 수도 있습니다. 교수님들께서도 음성 생성 AI를 활용하시면, 텍스트 자료를 음성으로 변환하여 연구나 수업에 활용하시는 것이 가능합니다. 음성 생성 AI 가운데 대표적인 프로그램인 네이버 클로바더빙에 대해 소개해드리겠습니다.
1. 음성생성 AI의 주요기능
1) TTS 기능 (Text-to-Speech)
TTS(Text-to-Speech) 기능은 앞서 보셨듯이 텍스트 입력만으로 동영상에 원하는 AI 음성을 입힐 수 있는 서비스입니다. 음성 합성 기술이 매우 뛰어나며 사용자는 수백 여개에 이르는 다양한 보이스 내에서 선택할 수 있습니다. 또한, 구체적인 상황에 적합한 보이스(ex. 리포터, 쇼호스트)도 제공합니다. 나아가, 영어 보이스도 제공하기 때문에 글로벌 수업에서 원어민스러운 발음의 영어 더빙을 생성하고자 하실 때 활용할 수 있습니다.
2) 자신의 목소리 더빙
자신의 목소리로 AI 보이스를 만들고자 한다면 사용자가 지원서 작성부터 스크립트 녹음까지 클로바더빙 앱으로 진행한 후 직접 AI 보이스 제작에 참여할 수 있습니다. 클로바더빙 앱을 설치한 후 희망하는 AI 보이스 스타일(ex. 구연동화, 내레이션, 일상대화 등)을 고르고 가이드에 따라 스타일을 최대한 살려 녹음한 뒤 지원서를 제출하면 만 14세 이상 누구나 언제든지 지원할 수 있습니다. 클로바의 ‘NES(Natural End-to-end Speech Synthesis) 기술’로 40분 수준의 짧은 녹음만으로 고품질의 합성음을 구현할 수 있습니다. 제작된 AI 보이스는 클로바더빙 서비스에서 누구나 무료로 사용할 수 있도록 최소 3년 이상 제공됩니다.
3) 저작권 표기 정책
네이버 클로바더빙에서는 무료 TTS 기능을 이용할 수 있으나, 제작된 콘텐츠에 클로바더빙을 활용해 제작하였음을 필수로 명시해야 합니다. 클로바더빙은 워터마크를 이용하거나, 클로바더빙을 이용하였음을 포함하는 자막, 혹은 제목을 제시하라고 안내하고 있습니다. 또한 클로바더빙의 안내에 따르면, 영상 업로드 시 설명란에는 반드시 음성의 출처를 표기해야 합니다.
▶ 워터마크를 통한 출처 표기
워터마크란 불법 복제를 막기 위해 개발된 기술로, 디지털 콘텐츠에 삽입된 이미지나 특정 부호 등을 지칭하기도 합니다. 클로바더빙 서비스를 이용해 동영상을 제작한 경우, 우측 상단에 워터마크가 자동 삽입된 것을 확인하실 수 있습니다. 그러나 클로바더빙에서 음원만을 다운로드 하여 영상에 사용할 경우, 따로 워터마크를 삽입해야 합니다. 이때 클로바더빙 고객센터에서 제공하는 워터마크 이미지(https://csmail.naver.com/naver/download.help?seq=49626)를 다운로드 받을 수 있습니다.
▶ 자막을 통한 출처 표기
자막으로 출처를 표기할 경우, 클로바더빙(CLOVA Dubbing)의 AI 음성을 활용했음을 영상의 시작부터 5초간 노출시켜야 합니다. 클로바더빙에서는 “클로바더빙의 AI 보이스가 사용되었습니다”, “CLOVA Dubbing 의 AI 보이스로 제작하였습니다”, “ 클로바더빙의 AI 보이스가 포함되어 있습니다” 와 같은 문구들을 예시로 보여주고 있습니다.
▶ 제목을 통한 출처 표기
클로바더빙은 feat, with과 같은 접속사를 사용해 제목 뒤에 클로바더빙(CLOVA Dubbing)을 포함시킬 것을 제시하고 있습니다. 클로바더빙에서는 “새로운 000을 소개합니다 feat. 클로바더빙”, “새로운 000을 소개합니다 (with Clova Dubbing)” 와 같은 예시를 보여주고 있습니다.
▶ 설명란의 출처 표기
클로바더빙은 아래 그림에서 제시하듯, 영상의 설명란에 서비스명(클로바더빙)과 사용된 AI 보이스의 이름을 해시태그 형태(#)로 작성하라고 안내하고 있습니다. “본 영상에는 클로바더빙(CLOVA Dubbing)의 AI 보이스가 사용되었습니다. #클로바더빙 #보이스명1 #보이스명2. URL: https://clovadubbing.naver.com”과 같은 방식으로 설명란에 출처를 표기할 수 있습니다.
워터마크나 자막을 삽입하는 것은 제작한 콘텐츠가 영상일 때 가능한 출처 표기 방식입니다. 만약 오디오북과 같이 영상이 아닌 음성만을 이용해 콘텐츠를 제작하실 경우, 클로바더빙이 활용되었다는 자막 텍스트를 콘텐츠 시작 부분에 음성으로 삽입하셔야 합니다. 클로바더빙은 무료로 제공되는 서비스로, 워터마크나 자막 등을 통해 출처 표기를 필수적으로 해야 합니다. 또한 클로바더빙 정책 상, AI 보이스와 합성음을 클로바더빙에서 다운받은 원형 그대로 사용해야 합니다. 클로바더빙으로 생성한 음성이 왜곡되거나, 음성의 품질이 저하되는 등 변형 및 편집을 해서는 안 됩니다.
2. 그 외 무료 더빙 프로그램
영상 및 오디오 콘텐츠 생산량이 증가하면서 AI 보이스를 삽입할 수 있는 프로그램도 다양해지고 있습니다. 따라서 클로바더빙 외에 무료로 사용하실 수 있는 TTS 제공 사이트 및 프로그램 두 가지를 소개합니다.
1) 온에어스튜디오 (https://onairstudio.ai/)
온에어스튜디오는 회원가입을 해야 하지만, 따로 프로그램을 설치할 필요 없이 사이트에서 이용 가능한 서비스입니다. PDF, PPT, Keynote와 Google Slide 등 파일을 업로드 한 후, 스크립트를 작성하면 AI 보이스를 더빙할 수 있습니다. 제작된 영상에는 워터마크가 자동으로 삽입되며, 콘텐츠를 채널에서 무료로 사용할 경우 출처를 밝히고 온에어스튜디오의 해시태그와 URL을 작성해야 합니다. 질 좋은 AI 보이스와 가상 모델 등을 이용할 수 있으나, 무료 서비스에서는 월간 총 15분의 콘텐츠를 다운받을 수 있으며, 5건의 프로젝트를 생성할 수 있습니다.
2) 프로소디 (https://www.prosody-tts.com/)
프로소디는 온에어스튜디오와는 달리, 프로그램을 다운 받아 사용 가능합니다. 행복, 화남, 슬픔, 실망, 흥분, 졸림, 공포 등 다양한 감정표현이 가능하며, 높낮이와 속도 역시 조절이 가능해 AI 더빙의 어색함을 극복할 수 있다는 장점이 있습니다. 화자와 감정을 선택하고, 생성하고자 하는 텍스트를 입력하면 쉽게 음성 조절을 하고 생동감을 줄 수 있습니다. 또, 최소 1시간 이상의 음성 녹음 데이터가 있을 경우, 사용자가 원하는 새로운 AI 보이스를 추가할 수 있습니다. 그러나 월 4,000자의 텍스트만을 음성 변환할 수 있다는 제약도 있습니다.
TTS(Text-to-Speech)는 문자 그대로 텍스트를 음성으로 변환하는 기술입니다. 이러한 TTS 기능을 쉽고 빠르게 이용 가능한 것이 네이버에서 서비스 중인 클로바더빙입니다. 영상에 AI 보이스를 삽입할 수 있고, 영상이나 PDF, 이미지 등에 다양한 음성과 효과음을 넣을 수 있으며 수백여 개에 달하는 AI 보이스를 제공한다는 장점을 지니고 있습니다. 한편 영상을 제작해 콘텐츠를 업로드하고자 하는 사용자의 수요가 증가하면서 TTS 기능을 제공하는 플랫폼 또한 증가하고 있습니다. TTS 서비스 플랫폼을 이용하면 한국어뿐만 아니라 영어, 중국어, 일어 등 외국어 음성 또한 영상에 삽입하는 것이 가능합니다. 또한 목소리의 높낮이와 속도를 조절하여 보다 자연스러운 AI 더빙이 가능하므로, 이러한 기능을 적절히 활용하신다면 쉽고 빠르게 온라인 자료를 생성하는 데 도움이 될 것입니다.
<참고문헌>
- https://www.aitimes.kr/news/articleView.html?idxno=25919
- https://clovadubbing.naver.com/voicemaker
- https://www.epnc.co.kr/news/articleView.html?idxno=92784
- https://help.naver.com/service/23823/contents/12465?lang=ko
- https://www.prosody-tts.com/