Real-Time-Voice-Cloning 사용방법
AI 음성 복제, 음성 합성
open source Voice Cloning project, Real Time Voice Cloning
Clone a voice in 5 seconds to generate arbitrary speech in real-time
https://github.com/CorentinJ/Real-Time-Voice-Cloning - 50.7k
- 2021년 마지막 업데이트
Python 3.7 이상 권장
//-----------------------------------------------------------------------------
< 설치 >
> git clone https://github.com/CorentinJ/Real-Time-Voice-Cloning
> cd Real-Time-Voice-Cloning
- python 3.9 가상 환경 생성
> C:\Python\Python39\python -m venv myenv
> call myenv\Scripts\activate.bat
- Install ffmpeg
> choco install ffmpeg
- Install PyTorch v1 (v2 미만) 설치
참고 : https://pytorch.org/get-started/previous-versions/
> pip install torch==1.13.1+cu117 torchvision==0.14.1+cu117 torchaudio==0.13.1 --extra-index-url https://download.pytorch.org/whl/cu117
- 필요 패키지 설치
> pip install -r requirements.txt
- Pretrained Model 다운로드
https://github.com/CorentinJ/Real-Time-Voice-Cloning/wiki/Pretrained-models
saved_models/default/ 폴더로 복사
- 테스트
python demo_cli.py
- (옵션) Dataset 다운로드
https://www.openslr.org/resources/12/train-clean-100.tar.gz
datasets/LibriSpeech/train-clean-100 폴더에 압축을 푼다.
- 참고 : 다른 데이터셋 주소
https://github.com/CorentinJ/Real-Time-Voice-Cloning/wiki/Training#datasets
- 시작
python demo_toolbox.py
- 원하는 자신의 음성파일 입력 방법
Browse 버튼 선택 -> 원하는 음성파일 선택
-> 원하는 글자를 쓰고 "Synthesize and vocode" 버튼 선택
결과는 매우 불만족
- Dataset을 지정한 경우
원하는 Dataset (목소리)으로 바꾸고 'Load' 버튼
-> 원하는 글자를 쓰고 "Synthesize and vocode" 버튼 선택
//-------------------------------------
참고
https://www.youtube.com/watch?v=xQtVO0GxJ14