- speech(audio, voice) to text software ( 음성( 음악 오디오 파일)을 텍스트(문자열)로 변환하는 프로그램 , 영어 파일 받아쓰기 유틸리티 소프트웨어)
https://github.com/mozilla/DeepSpeech - 16.3k
- 2021/01 , v0.10.0-alpha.3
- 구글 TensorFlow를 사용한 오픈 소스 Speech-To-Text 엔진
- 매뉴얼
https://deepspeech.readthedocs.io
//-------------------------------
< 기본 환경 >
파이썬 3 이상 필요
* pipx 설치
python3 -m pip install --user pipx
python3 -m pipx ensurepath
- 설치 경로
파이썬설치경로\Scripts
* virtualenv 설치
pipx install virtualenv
//--------------------------------------
< DeepSpeech 설치 >
# virtualenv 설치(파이썬 실행 가상환경)
virtualenv -p python3 d:\z\deepspeech-venv
cd d:\z\deepspeech-venv\
scripts\activate.bat
# DeepSpeech 설치
pip3 install deepspeech
# pre-trained English 모델 다운로드
curl -LO https://github.com/mozilla/DeepSpeech/releases/download/v0.9.3/deepspeech-0.9.3-models.pbmm
curl -LO https://github.com/mozilla/DeepSpeech/releases/download/v0.9.3/deepspeech-0.9.3-models.scorer
# 예제 오디오 파일 다운로드
curl -LO https://github.com/mozilla/DeepSpeech/releases/download/v0.9.3/audio-0.9.3.tar.gz
tar xvf audio-0.9.3.tar.gz
# 오디오 파일을 문자열로 자동 인식 변환
deepspeech --model deepspeech-0.9.3-models.pbmm --scorer deepspeech-0.9.3-models.scorer --audio audio/2830-3980-0043.wav > result.txt
- 주의! 오디오 파일 포맷
wav , 16bit, 16,000hz , 모노
//-------------------------------------------------------------------------------
// 참고
음성 문자로 변환 프로그램
Braina
https://www.brainasoft.com/braina/
tazti
https://www.tazti.com/downloads.php
//-------------------------------------
Dragon Home version 15 speech recognition (비추)
https://www.nuance.com/dragon/dragon-for-pc/home-edition.html
Nuance Dragon Professional Individual
- 주의! 한국어 로캐일에서 설치 안되고 문제 많음- 음성파일을 텍스트로 변환하는 기능 없음
//-----------------------------------------------------------------------------
참고! 설치 에러 해결 방법
Nuance Dragon Professional Individual NaturallySpeaking15 설치에러
- 에러 메시지
install Error 1324 the path dradon 4voice contains an invalid character
- 해결 방법
윈도우 언어 로캐일 변경
제어판 -> 국가 또는 지역 -> '관리자 옵션' 탭
-> '시스탬 로캘 변경' 버튼 -> 영어(미국) 선택 -> 재부팅
//---------------------------
// 자동 인식 프로그램이 아님, 사용자가 직접 써야 함
transcribe software
Transcribe!
https://www.seventhstring.com/xscribe/overview.html
NCH Express Scribe Transcription Software
https://www.nch.com.au/scribe/
f4transkript
https://www.audiotranskription.de/english/
'AI' 카테고리의 다른 글
Nvidia GPU 코어 클럭이 일정 이상 올라가지 않는 문제 해결 방법 (0) | 2023.02.03 |
---|---|
Stable Diffusion web UI 사용법, 에러 해결 방법 (0) | 2022.11.10 |
자연어 처리(NLP ) 역사, AI 역사 (0) | 2022.07.24 |
[NLP] GPT-2 사용법 (windows) (0) | 2022.07.23 |
[ML] AllenNLP - PyTorch 자연어 처리 라이브러리 (0) | 2020.10.05 |