Speechlab

Email Tisk PDF

Laboratoř počítačového zpracování řeči patří k vedoucím pracovištím v oboru hlasových technologií v České republice. Organizačně spadá pod Ústav informačních technologií a elektroniky. Byla založena v roce 1994 prof. Janem Nouzou, který se zabýval zpracováním a rozpoznáváním řeči od jeho vysokoškolského studia v 80. letech 20. století. V současné době má tým 10 pracovníků, kteří mají Ph.D. titul v oboru zpracování a rozpoznávání řeči nebo obrazu.

Obrázek uvedený níže je mozaika složená z našich starších zajímavých praktických projektů , kde byl prvně využit námi vyvíjený automatický systém rozpoznávání řeči pro češtinu (od roku 1990 do počátku 21. století). Byl to například systém VISPER pro vizualizaci a experimentování se skrytými markovskými modely - HMMs (Hidden Markov Models), je zde také zobrazeno několik vyvinutých dialogových systémů, umělá mluvící tvář, program pro hlasové ovládání PC, který je vhodný především pro pohybově hendikepované lidi, atd.

speechlab.jpg

Od roku 1996 se náš tým podílel na výzkumu as vývoji řečových technologií ve více než 15 velkých výzkumných projektech, které byly podporovány českými grantovými agenturami (GAČR, TAČR), případně českým ministerstvem kultury. Byli jsme také aktivními partnery v několika evropských projektech COST (Cooperation in Science and Technology).

V posledních deseti letech (2011-2020) jsme řešili celou řadu zajímavých výzkumných projektů z oblasti moderních řečových technologií, kde vznikli plně funkční praktické realizace:

  • Vývoj systému pro automatický přepis pořadů historického archívu Českého a Československého archívu, kde bylo automaticky přepsáno a zaindexováno více než 100 000 hodin zvukových nahrávek (4-letý projekt Ministerstva kultury České republiky), viz publikace z konference Intespeech [1]
  • Vývoj on-line vícejazyčného systému pro přepis televizních a rozhlasových pořadů, který pracuje s rozpoznávačem řeči vytvořeným pro 13 různých slovanských jazyků (projekt byl podpořen 2 velkými projekty Technologické agentury České republiky - TAČR), viz publikace [2, 3, 4]
  • Vývoj systému pro velmi rychlé vyhledávání klíčových slov (a krátkých slovních spojení) v rozsáhlých zvukových archívech (projekt podpořen projektem TAČR), viz publikace [5]
  • Návrh a modifikace metod založených na umělých neuronových sítí pro rozpoznávání informace a zajímavých částí zvukového signálu (detekce ne/řečových úseků, identifikace mluvčích, identifikace použitého jazyka, atd.), viz publikace [6, 7, 8]

Náš výzkum vedl k celé řadě praktických komerčních řečových technologií a systémů. Většina z nich je využívána a prodávána společností Newton Technologies:

Pokud jste student, postdoktorand nebo komerční firma zajímající se o náš výzkum, tak nás kontaktujte, nejlépe e-mailem:

jan.nouza AT tul.cz, petr.cerva AT tul.cz