AI

Real-Time-Voice-Cloning 사용방법

codens 2024. 4. 19. 05:29

AI 음성 복제, 음성 합성

open source Voice Cloning project, Real Time Voice Cloning 


Clone a voice in 5 seconds to generate arbitrary speech in real-time
https://github.com/CorentinJ/Real-Time-Voice-Cloning - 50.7k
    - 2021년 마지막 업데이트

Python 3.7 이상 권장

//-----------------------------------------------------------------------------

< 설치 >
> git clone https://github.com/CorentinJ/Real-Time-Voice-Cloning
> cd Real-Time-Voice-Cloning

    - python 3.9 가상 환경 생성
> C:\Python\Python39\python -m venv myenv
> call myenv\Scripts\activate.bat

     - Install ffmpeg
> choco install ffmpeg

     - Install PyTorch v1 (v2 미만) 설치
    참고 : https://pytorch.org/get-started/previous-versions/
> pip install torch==1.13.1+cu117 torchvision==0.14.1+cu117 torchaudio==0.13.1 --extra-index-url https://download.pytorch.org/whl/cu117

     - 필요 패키지 설치
> pip install -r requirements.txt

     - Pretrained Model 다운로드 
https://github.com/CorentinJ/Real-Time-Voice-Cloning/wiki/Pretrained-models
saved_models/default/ 폴더로 복사

     - 테스트
python demo_cli.py

     - (옵션) Dataset 다운로드
https://www.openslr.org/resources/12/train-clean-100.tar.gz
datasets/LibriSpeech/train-clean-100 폴더에 압축을 푼다.

     - 참고 : 다른 데이터셋 주소 
https://github.com/CorentinJ/Real-Time-Voice-Cloning/wiki/Training#datasets


     - 시작
python demo_toolbox.py

     - 원하는 자신의 음성파일 입력 방법
Browse 버튼 선택 -> 원하는 음성파일 선택 
-> 원하는 글자를 쓰고 "Synthesize and vocode" 버튼 선택

 

결과는 매우 불만족



     - Dataset을 지정한 경우
원하는 Dataset (목소리)으로 바꾸고  'Load' 버튼 
-> 원하는 글자를 쓰고 "Synthesize and vocode" 버튼 선택



//-------------------------------------
참고

https://www.youtube.com/watch?v=xQtVO0GxJ14

 

반응형