Speechlab

Email Tisk PDF

Laboratoř počítačového zpracování řeči patří k vedoucím pracovištím v oboru hlasových technologií v České republice. Organizačně spadá pod Ústav informačních technologií a elektroniky a založena byla v roce 1994.

speechlab.jpg

Naší hlavní výzkumnou doménou byla a je oblast rozpoznávání řeči. Začátkem 90. letech byla naše pozornost zaměřena především na řešení problematiky rozpoznávání izolovaně pronášených slov a frází, později jsme se začali věnovat i nejsložitější úloze - rozpoznávání plynulé řeči. V současné době námi vyvinuté systémy zvládají rozpoznávání jednotlivých slov z rozsáhlých slovníků obsahujících řádově stovky tisíc slov, a to od libovolného mluvčího, v reálném čase (do 1 s) a s úspěšností nad 95 % - nejen na PC ale dokonce i na mobilním přístroji. U spojité řeči se procento správně rozpoznaných slov pohybuje kolem 90 % u přepisování televizních popř. rozhlasových pořadů a kolem 95 – 97 % u spojitého diktování libovolnou osobou (se slovníkem 500 000 slov). Je třeba si však uvědomit, že jde o velmi komplikovanou úlohu, zejména v češtině, jejíž slovník čítá několik milionů různých slovních tvarů.

Naším krédem je dělat nejen teoreticky zaměřený výzkum, ale vždy jej také ověřovat na konkrétních aplikacích a úlohách z praxe. Příkladem takto do praxe dovedených aplikací jsou naše programy MyDictate a MyVoice (navržené pro potřeby hendikepovaných osob), dále NewtonDictate (nejlepší český program pro spojité diktování, vyvinutý ve spolupráci s firmou Newton Technologies a.s.), ATT Toolkit (program pro přepis televizních a rozhlasových pořadů nasazený ve firmě Newton Media), či starší programy InfoCity nebo Visper.