Kospeech - STT 공부

생성일

2022/09/01 01:28

태그

STUDY

STT를 구현하기 위해서는

•

음성 데이터

•

음성 데이터를 전사해놓은 Lable

이 필요하다.

전사 : 들리는 바를 받아 적되, ‘음', ‘어', ‘그' 와 같은 간투어, 대본에서 빼먹은 단어, 주변의 소음 등에 따라 녹음된 내용을 사람이 기록해놓은 것을 말한다.

사용자

→ 데이터의 특징에 따라 전사 규칙을 삭제하고, 문장부호(’!’, ‘?’, ‘,’ , ‘.’)를 삭제하는 등의 전처리 진행해야한다

→ kospeech는 본인들이 사용한 ai-hub의 데이터(kspon)와 libri 에 한해 전처리 과정 또한 공개하였다.