글을 음성으로 변환하여 읽어주는 프로그램(Open Source AI)


https://github.com/coqui-ai/TTS - 10.9k
   - GitHub에서 가장 별이 많고, 다음 많은 Mozilla TTS는 마지막 업데이트가 2021년

 


    - 설치
pip install TTS

   - 참고만 : 프로그램 소스를 통해 설치하고 싶은 경우
git clone https://github.com/coqui-ai/TTS

cd TTS

pip install -e .[all,dev,notebooks] 


     - 모델 리스트
tts --list_models


     - 모델 정보
tts --model_info_by_name "tts_models/en/ljspeech/tacotron2-DDC"


     - 기본 모델 사용
tts --text "Text for TTS" --out_path speech.wav


     - 모델 지정 & cuda 사용
tts --use_cuda USE_CUDA --model_name "tts_models/en/ljspeech/tacotron2-DDC_ph" --out_path "speech_ttd_ph_l.wav" --text "Festival is written in C++ and C# and uses the Edinburgh Speech Tools Library, and it is provided under an X11 license which allows for both commercial and non-commercial use."

 

//-----------------------------------------------------------------------------

< 한국어 사용 방법 > 

    - 모델
https://huggingface.co/coqui/XTTS-v2

    -  사용법
https://docs.coqui.ai/en/latest/models/xtts.html

    -  언어 인덱스 확인
tts --model_name tts_models/multilingual/multi-dataset/xtts_v2 --list_language_idx

    -  목소리 인덱스 확인
tts --model_name tts_models/multilingual/multi-dataset/xtts_v2 --list_speaker_idx

    - TTS 실행
tts --use_cuda USE_CUDA --model_name "tts_models/multilingual/multi-dataset/xtts_v2" --language_idx ko --speaker_idx "Ana Florence"  --out_path "speech_ko-ana.wav"  --text "광막한 우주와 끝없는 시간속에서, 이 작은 행성과 스쳐가는 찰나를 당신과 함께 해서 행복했습니다." 

 

 

//-----------------------------------------------------------------------------

< 참고 >
https://github.com/coqui-ai/TTS - 10.9k

https://github.com/mozilla/TTS - 7.2k

https://github.com/neonbjb/tortoise-tts - 6.2k

https://github.com/espeak-ng/espeak-ng - 2k
https://github.com/nateshmbhat/pyttsx3 - 1.5k
https://github.com/rhasspy/larynx - 762
https://github.com/MycroftAI/mimic3 - 672

 

 

반응형
Posted by codens