github Link
ย E2E ์์ฑ์ธ์ ์์ง์ ํ์ฉํ Real Time LipSync
ย ๋งก์ ์ญํ
โข
ํ๋ก ํธ์๋ (using Python, Pygame)
โข
์์ผ ํต์ (using Python)
ย Engine ์๋ฆฌ
ย Engine ๊ธฐ๋ฅ
TTI (Text To Image)
โข
๋ฌธ์ ์
๋ ฅ์ ๋ฐ์์ ๋ฆฝ์ฑํฌ ์ด๋ฏธ์ง๋ฅผ ์ถ๋ ฅํ๋ค
STI (Speech To Image)
โข
๋งํ๋ ์์ฑ์ ์ค์๊ฐ์ผ๋ก ๋ฆฝ์ฑํฌ ์ด๋ฏธ์ง๋ฅผ ์ถ๋ ฅํ๋ค
Two-way & Realtime Communication
โข
์ค์๊ฐ์ผ๋ก ์๋ฐฉํฅ์ผ๋ก ์ํต์ด ๊ฐ๋ฅํ๋ค
โข
์๋ก์ ์บ๋ฆญํฐ์ ์
๋ชจ์์ด ์์ง์ด๋ ๊ฒ์ด ๋ณด์ธ๋ค
STT (Speech To Text)
โข
์์ฑ ์
๋ ฅ์ ๋ฐ์์ ํ
์คํธ๋ก ์ถ๋ ฅํ๋ค
RNN-T Korean
โข
ํ๊ตญ์ด๋ก ๋ฒ์ญํด์ฃผ๋ ๊ธฐ๋ฅ
ย ํ์ต ๋ชจ๋ธ
ย ์๋ฒ ์ฌ์
โข
GPU : 8x NVIDIA A100
โข
RAM : ๊ณ์ ๋น 5GB
โข
RunTime : ๋ฌดํ
โข
Costs : Free