Speechlab

Home MyDictate
MyDictate PDF Tisk Email

MyDictate – program pro izolované diktování slov do počítače

mydictate.jpg

Program MyDictate byl vyvinut jako účinný doplněk a nadstavba již existujícího programu pro hlasové ovládání počítače (MyVoice). Při jeho vývoji byl brán hlavní zřetel opět na handicapované osoby, které nemohou používat ruce. Výhody diktovacího programu však jistě ocení i další, kteří musí často zadávat text do počítače a přitom nejsou příliš zruční v rychlém psaní na klávesnici. Vzhledem k primárnímu určení byla zvolena strategie diktování po jednotlivých slovech, mezi kterými je třeba vždy udělat krátkou pauzu. Tato strategie má dvě základní výhody:
  1. Umožňuje okamžitě hlasem provádět opravy v případě chybně rozpoznaných nebo stejně znějících slov.
  2. Zvládá diktování s obrovským slovníkem (který je pro češtinu nutností) i na běžné výpočetní technice.
Princip rozpoznávání diktovaného textu počítačem

Systém pro izolované diktování zpracovává zvukový signál snímaný mikrofonem, snaží se detekovat začátek a konec promluvy reprezentující jednotlivá slova a najít z předem připraveného slovníku vždy jedno konkrétní slovo, jehož matematický model co nejvíce odpovídá zaznamenané promluvě. Kromě jednotlivých slov daného jazyka ovšem slovník diktovacího systému často obsahuje i speciální řídicí povely, např. pro formátování a pohyb v textu, jež převádí na virtuální stisky kláves.

Charakteristiky programu MyDictate
  • Program umožňuje diktování všem osobám, které jsou schopny dobře vyslovovat a zároveň očima sledovat dění na obrazovce počítače.
  • Diktovat je možné do libovolného programu běžícího pod operačním systémem Windows XP CZ ( Windows 2000 ) do místa, kde je umístěn kurzor.
  • Diktovat je nutné po jednotlivých výrazech, nikoli plynulou řečí. Program je pro tento účel vybaven rozsáhlým slovníkem čítajícím přes 525 000 nejfrekventovanějších českých slov a výrazů (např. zkratek, uživatelských frází, apod.)
  • Slova a výrazy, které nejsou obsaženy ve slovníku, je možné nadiktovat po jednotlivých znacích a následně je hned doplnit do slovníku, a to vše opět za použití hlasových povelů (bez nutnosti dotýkat se klávesnice).
  • Program MyDictate je standardně vybaven mužským a ženským hlasovým profilem. Navíc si může uživatel programu MyDictate vytvořit vlastní hlasový profil na základě namluvení předepsané nevelké skupiny výrazů. Použitím tohoto adaptovaného profilu se pak minimalizuje možnost nepřesného rozpoznání vyřčených výrazů. Tato možnost může velmi pomoci zejména lidem s mírnou vadou řeči.
  • V případě nepřesného či nejednoznačného rozpoznání vyřčeného výrazu lze jediným povelem provést náhradu vybráním z podobných slov, které program automaticky nabídne.
  • Hlasem lze provádět i složitější editaci nadiktovaného textu s využitím široké skupiny připravených editačních povelů.
Popis programu

V horní části hlavního okna programu (Obrázek) je červenou barvou znázorněno naposledy rozpoznané slovo (zde „funkcí“), které je zároveň vytisknuto na obrazovku do otevřeného textového editoru. blogDH.jpgPod tímto slovem je zobrazen seznam deseti slov, která byla během rozpoznávání vybrána jako další nejpravděpodobněji vyslovená. Tento seznam slov slouží pro rychlou opravu nadiktovaného textu pomocí povelů typu VEZMI_PRVNÍ až vezmi „VEZMI_DESÁTÝ.

Pokud skutečně vyřknutý výraz v seznamu nejpravděpodobnějších kandidátů není, je možné chybně vytištěný výraz vymazat povely, respektive opakováním povelů, VYMAŽ_SLOVO nebo VYMAŽ_DVĚ_SLOVA a poté zamýšlené slovo znovu nadiktovat. Občas se také stane, že rozpoznané slovo se od slova, které bylo ve skutečnosti řečeno, liší např. jen v koncovce, respektive v posledním znaku. V tomto případě je možné odstranit poslední znak povelem VYMAŽ_ZNAK a následně dodiktovat správné znaky pomocí povelů ZNAK_ADAM až ZNAK_ŽOFIJE. Všechny výše zmíněné povely pak dohromady umožňují okamžitou jednoduchou opravu každého špatně rozpoznaného slova, což je pro češtinu zvlášť důležité, neboť díky tomu, že patří mezi jazyky ohebné, liší se v ní často jednotlivá slova od sebe akusticky jen velmi málo.

Kromě těchto povelů obsahuje MyDictate i další hlasové povely, které mohou být použity pro:
  • aktivaci a deaktivaci rozpoznávání (v případě že chce uživatel například vést dialog s další osobou či telefonovat),
  • modifikaci slovníku,
  • pohyb kurzoru v textu a jeho vývěr, mazání či kopírování do schránky,
  • ukončení programu MyDictate s spuštění programu MyVoice,
  • změnění velikosti počátečního písmene naposledy nadiktovaného slova,
  • napsání jednoho konkrétního znaku nebo speciálního symbolu.
Přesnost rozpoznávání se standardně pohybuje nad hladinou 90 %. Pokud si navíc uživatel provede adaptaci na svůj hlas (celá procedura netrvá více než 20 minut), zvyšuje se úspěšnost o další 2 – 3 %. S programem pracuje již několik desítek lidí (např. blog Dity Horochovské ) a byly jím také napsaná diplomová práce na Právnické fakultě MU v Brně.


Bližší informace o programu MyDictate a videoukázky dokumentující jeho možnosti lze získat na internetových stránkách distributora programu, firmy FugaSoft - www.fugasoft.cz