Speechlab

ConDictate PDF Tisk Email

Voice dictation to a computer (2004/05)

(Czech only)

V roce 2003 jsme odborné veřejnosti představili prototyp prvního hlasového diktovacího systému pro češtinu. Jeho omezení spočívalo v tom, že bylo nutné text diktovat slovo po slovu, vždy s krátkou mezerou mezi slovy. Na druhé straně systém pracoval se slovníkem obsahujícím 400 tisíc nejčastějších slov a slovních tvarů, což už je téměř 99 % celé slovní zásoby českého jazyka. Systém též umožňoval hlasem ovládané formátování textu a editaci chybně rozpoznaných slov. V roce 2004 byl tento systém dále rozšířen, zejména co se týče rozsahu slovníku (600 000 slov), rychlosti a úspěšnosti správného rozpoznávání, která nyní činí kolem 90 - 93 %.

V roce 2004 byl také představen funkční prototyp systému, umožňující diktování textu plynulou řečí, tj. po celých větách. Protože rozpoznávání spojité řeči je mnohem obtížnější a výpočetně náročnější úloha, současná výpočetní technika zatím systému umožňuje pracovat se slovníkem pouze do 100 000 slov (na počítači s procesorem 2,5 GHz). Úspěšnost rozpoznávání se pohybuje kolem 80 - 90 % správně rozpoznaných slov (v závislosti na typu textu). Rozpoznávání je podporováno složitým akustickým a jazykovým modelem, pro jejichž tvorbu bylo použito cca 40 hodin nahrávek řeči od cca 300 lidí a dále velké množství elektronických textů, na nichž se hledalo optimální složení slovníku a vztahy mezi jednotlivými slovy.

Oba systémy mohou být okamžitě používány libovolnou osobou. Pro konkrétní osobu je též možné provést adaptaci (na základě několika desítek slov či vět), po níž se úspěšnost systému dále zlepší.

Ukázka spojitého diktování

diktat.jpg