AI를 통해 좋아하는 캐릭터의 TTS를 만들어보자! – Bert-VITS2

2023년 12월 27일
 | 
Info-Geon

최근 AI를 이용한 많은 것들이 만들어지고 있는 와중에, 저는 음성 AI에 관련하여 몇가지 프로그램을 사용하다가 마음에 드는 목소리가 없어서 직접 학습시켜 만들어보고자 하였습니다.

하지만 생각보다 넘어야 할 관문이 많더라구요…

이 시리즈의 목표는 윈도우10 환경에서 WLS2를 사용하여 Bert-VITS2 모델을 Custom data로 훈련시키고, 추론을 통해 음성을 만들어 볼 예정입니다!

일단 생각하고 있는 목차는 다음과 같아요.

  • Chapter 5. 모델 훈련 뒤, 음성 추출
  • 번외 1. 커스텀 학습 데이터 추출하는 방법
 
이렇게 5가지로 생각하고 있습니다.

시간이 날 때마다 글을 하나씩 써 내려가도록 하겠습니다!

참고로 이 모델은 적어도 100k steps(추천은 1M steps) 이상은 학습을 시켜야하기 때문에, 적어도 몇십시간은 학습시켜야 합니다! 그렇기 때문에 바로바로 결과가 나오기는 바라시는 분은 Vall-E X를 사용해보시기를 바래요!