최근 AI를 이용한 많은 것들이 만들어지고 있는 와중에, 저는 음성 AI에 관련하여 몇가지 프로그램을 사용하다가 마음에 드는 목소리가 없어서 직접 학습시켜 만들어보고자 하였습니다.
하지만 생각보다 넘어야 할 관문이 많더라구요…
이 시리즈의 목표는 윈도우10 환경에서 WLS2를 사용하여 Bert-VITS2 모델을 Custom data로 훈련시키고, 추론을 통해 음성을 만들어 볼 예정입니다!
일단 생각하고 있는 목차는 다음과 같아요.
시간이 날 때마다 글을 하나씩 써 내려가도록 하겠습니다!
참고로 이 모델은 적어도 100k steps(추천은 1M steps) 이상은 학습을 시켜야하기 때문에, 적어도 몇십시간은 학습시켜야 합니다! 그렇기 때문에 바로바로 결과가 나오기는 바라시는 분은 Vall-E X를 사용해보시기를 바래요!
MSM은 건강 보조제로 널리 사용되며, 특히 관절 건강을 개선하고 통증을 완화하는 데 도움을 준다고 알려져…
칼슘은 우리 몸에서 가장 풍부하게 존재하는 미네랄로, 전체 체중의 약 1-2%를 차지하며 주로 뼈와 치아에…
크롬은 필수 미량 원소 중 하나로, 인체 내에서 다양한 생화학적 반응에 관여하는 영양소입니다. 주로 혈당…
레시틴은 자연적으로 나타나는 물질로, 대개 달걀 노른자, 콩, 해바라기 씨와 같은 식품에서 발견됩니다. 이 물질은…
L-글루타민은 우리 몸에 존재하는 아미노산 중 하나로, 단백질 합성과 면역 기능에 중요한 역할을 합니다. 이천년대…
아스타잔틴은 자연에서 발견되는 카로티노이드 계열의 강력한 항산화제입니다. 일반적으로 홍합, 새우, 그리고 특히 연어와 같은 해양…