- speech(audio, voice) to text software ( 음성( 음악 오디오 파일)을 텍스트(문자열)로 변환하는 프로그램 , 영어 파일 받아쓰기 유틸리티 소프트웨어)



https://github.com/mozilla/DeepSpeech - 16.3k

    - 2021/01 ,  v0.10.0-alpha.3

    - 구글 TensorFlow를 사용한  오픈 소스 Speech-To-Text 엔진

 

    - 매뉴얼

https://deepspeech.readthedocs.io



//-------------------------------

< 기본 환경 >

 

파이썬 3 이상 필요



* pipx 설치

python3 -m pip install --user pipx

python3 -m pipx ensurepath

 

    - 설치 경로

파이썬설치경로\Scripts



* virtualenv 설치

pipx install virtualenv




//--------------------------------------

< DeepSpeech 설치 >

 

# virtualenv 설치(파이썬 실행 가상환경)

virtualenv -p python3 d:\z\deepspeech-venv

 

cd d:\z\deepspeech-venv\

scripts\activate.bat



# DeepSpeech 설치

pip3 install deepspeech



# pre-trained English 모델 다운로드

curl -LO https://github.com/mozilla/DeepSpeech/releases/download/v0.9.3/deepspeech-0.9.3-models.pbmm

curl -LO https://github.com/mozilla/DeepSpeech/releases/download/v0.9.3/deepspeech-0.9.3-models.scorer



# 예제 오디오 파일 다운로드

curl -LO https://github.com/mozilla/DeepSpeech/releases/download/v0.9.3/audio-0.9.3.tar.gz

tar xvf audio-0.9.3.tar.gz



# 오디오 파일을 문자열로 자동 인식 변환

deepspeech --model deepspeech-0.9.3-models.pbmm --scorer deepspeech-0.9.3-models.scorer --audio audio/2830-3980-0043.wav > result.txt



    - 주의! 오디오 파일 포맷

wav , 16bit, 16,000hz , 모노




//-------------------------------------------------------------------------------

// 참고

음성 문자로 변환 프로그램



Braina

https://www.brainasoft.com/braina/



tazti

https://www.tazti.com/downloads.php


//-------------------------------------

Dragon Home version 15 speech recognition (비추)

https://www.nuance.com/dragon/dragon-for-pc/home-edition.html

 

Nuance Dragon Professional Individual 
    - 주의! 한국어 로캐일에서 설치 안되고 문제 많음- 음성파일을 텍스트로 변환하는 기능 없음


//-----------------------------------------------------------------------------
참고! 설치 에러 해결 방법
Nuance Dragon Professional Individual  NaturallySpeaking15 설치에러

    - 에러 메시지
install Error 1324 the path dradon 4voice contains an invalid character

    - 해결 방법
윈도우 언어 로캐일 변경
제어판 -> 국가 또는 지역 -> '관리자 옵션' 탭 
    -> '시스탬 로캘 변경' 버튼 -> 영어(미국) 선택 -> 재부팅

 

 

//---------------------------

// 자동 인식 프로그램이 아님, 사용자가 직접 써야 함

transcribe software

 

Transcribe!

https://www.seventhstring.com/xscribe/overview.html



NCH Express Scribe Transcription Software

https://www.nch.com.au/scribe/



f4transkript

https://www.audiotranskription.de/english/



반응형
Posted by codens