Search
Duplicate

Kospeech - STT 공부

생성일
2022/09/01 01:28
태그
STUDY
STT를 구현하기 위해서는
음성 데이터
음성 데이터를 전사해놓은 Lable
이 필요하다.
전사 : 들리는 바를 받아 적되, ‘음', ‘어', ‘그' 와 같은 간투어, 대본에서 빼먹은 단어, 주변의 소음 등에 따라 녹음된 내용을 사람이 기록해놓은 것을 말한다.
사용자
→ 데이터의 특징에 따라 전사 규칙을 삭제하고, 문장부호(’!’, ‘?’, ‘,’ , ‘.’)를 삭제하는 등의 전처리 진행해야한다
→ kospeech는 본인들이 사용한 ai-hub의 데이터(kspon)와 libri 에 한해 전처리 과정 또한 공개하였다.