Real-Time-Voice-Cloning 사용방법

AI 2024. 4. 19. 05:29

AI 음성 복제, 음성 합성

open source Voice Cloning project, Real Time Voice Cloning

Clone a voice in 5 seconds to generate arbitrary speech in real-time
https://github.com/CorentinJ/Real-Time-Voice-Cloning - 50.7k
- 2021년 마지막 업데이트

Python 3.7 이상 권장

//-----------------------------------------------------------------------------

< 설치 >
> git clone https://github.com/CorentinJ/Real-Time-Voice-Cloning
> cd Real-Time-Voice-Cloning

    - python 3.9 가상 환경 생성
> C:\Python\Python39\python -m venv myenv
> call myenv\Scripts\activate.bat

   - Install ffmpeg
> choco install ffmpeg

   - Install PyTorch v1 (v2 미만) 설치
    참고 : https://pytorch.org/get-started/previous-versions/
> pip install torch==1.13.1+cu117 torchvision==0.14.1+cu117 torchaudio==0.13.1 --extra-index-url https://download.pytorch.org/whl/cu117

   - 필요 패키지 설치
> pip install -r requirements.txt

   - Pretrained Model 다운로드
https://github.com/CorentinJ/Real-Time-Voice-Cloning/wiki/Pretrained-models
saved_models/default/ 폴더로 복사

   - 테스트
python demo_cli.py

   - (옵션) Dataset 다운로드
https://www.openslr.org/resources/12/train-clean-100.tar.gz
datasets/LibriSpeech/train-clean-100 폴더에 압축을 푼다.

   - 참고 : 다른 데이터셋 주소
https://github.com/CorentinJ/Real-Time-Voice-Cloning/wiki/Training#datasets

   - 시작
python demo_toolbox.py

   - 원하는 자신의 음성파일 입력 방법
Browse 버튼 선택 -> 원하는 음성파일 선택
-> 원하는 글자를 쓰고 "Synthesize and vocode" 버튼 선택

결과는 매우 불만족

- Dataset을 지정한 경우
원하는 Dataset (목소리)으로 바꾸고 'Load' 버튼
-> 원하는 글자를 쓰고 "Synthesize and vocode" 버튼 선택

//-------------------------------------
참고

https://www.youtube.com/watch?v=xQtVO0GxJ14

저작자표시 (새창열림)

'AI' 카테고리의 다른 글

huggingface 사용법 (인증, 다운로드 방법) (0)	2024.04.28
WebUI for LLMs (Ollama WebUI) 사용법 (0)	2024.04.23
[LLM] stablelm-2-12b-chat 사용법 (0)	2024.04.16
AI 음악 생성 - AudioCraft 사용 방법 (0)	2024.04.02
Ollama 사용법 (0)	2024.01.11

Posted by codens

코드루덴스

Real-Time-Voice-Cloning 사용방법

'AI' 카테고리의 다른 글

카테고리

최근에 올라온 글

최근에 달린 댓글

태그목록

티스토리툴바


	by codens