Počítačový softvér, ktorý automaticky prepíše ľudský hlas do slovenčiny, má urýchliť prepis dokumentov zo súdnych pojednávaní.
Autor TASR
,aktualizované Košice 21. apríla (TASR) - Košickí technici sa môžu chváliť počítačovým softvérom, ktorý je na Slovensku unikátnym. Na Katedre elektroniky a multimediálnych telekomunikácií Technickej univerzity (TU) sa im po dlhoročných výskumoch v rečových technológiách podarilo v spolupráci s Ústavom informatiky Slovenskej akadémie vied vyvinúť nástroj, ktorý automaticky prepíše ľudský hlas do slovenčiny. Zjednodušene tomu hovoria diktačný systém.
"Je to automatický písací stroj. Primárne je určený na použitie pre justíciu," povedal v rozhovore pre TASR docent Jozef Juhár z košickej katedry. Na systéme, ktorý vyvinuli pre ministerstvo spravodlivosti, je podľa neho stále čo vylepšovať, závisí totiž do značnej miery od textových zdrojov v elektronickej podobe. Softvér má urýchliť prepis dokumentov zo súdnych pojednávaní.
"Systém funguje tak, že je naučený, čiže má v sebe zakomponované matematické modely hlasu, gramatiku a text," vysvetlil Juhár. Matematické modely sú vypočítavané z reálnych nahrávok a reálnych textov. Výskumníci potrebujú obrovskú databázu. Momentálne majú už stovky hodín nahrávok a asi dve miliardy slov v textoch. Pre širšie využitie softvéru by ich potrebovali stonásobne viac.
Matematický model "sa učí" od niekoľko stoviek hovoriacich. "Máme natrénované modely pre priemerného muža a ženu," povedal Juhár. Softvér by sa však podľa neho dokázal prispôsobiť na svojho konkrétneho používateľa, ktorého hlas si nahrá. "Systém si upraví model a urobí jeho profil."
Katedra "prerazila" vo svojich rečových výskumoch už skôr. Výrazným pokrokom bolo už v rokoch 2003-2006 vytvorenie prvej praktickej aplikácie, ktorá umožňovala získavať cez telefón informácie o počasí a cestovných poriadkoch. Záujemca zavolal na určité číslo, ozval sa mu systém a v dialógu otázka-odpoveď sa pýtajúci dopracoval k informácii. Systém je v univerzitnom laboratóriu stále funkčný.
"Teší nás, že má stálu skupinu niekoľkých používateľov, sú to zrakovo postihnutí ľudia, tí si to chvália," povedal Juhár. Technici teraz pracujú na tom, aby sa mohol rozšíriť aj na smartfóny. Do výskumov zapája katedra aktívne svojich študentov. "Študent sa nemá učiť len pred tabuľou, ale v laboratóriu," zdôraznil Juhár.
Podobné softvérové produkty existujú podľa Juhára aj v angličtine. "V súčasnosti sa vyvíjajú a dostávajú aj do praktického používania produkty na národných bázach 'menšinových' jazykov - napr. v češtine, poľštine a podobne," povedal TASR Juhár. "My sme sa pustili do vývoja systému v slovenčine a úspešne v ňom napredujeme. Softvér je teda unikátny v národnom meradle," dodal.
Pokiaľ ide o patentovanie výsledkov, počas výskumu a vývoja má katedra viacero originálnych postupov. Juhár vysvetlil, že ide o matematické a softvérové postupy, ktorých patentovanie však vo všeobecnosti neumožňuje európska legislatíva.
"Je to automatický písací stroj. Primárne je určený na použitie pre justíciu," povedal v rozhovore pre TASR docent Jozef Juhár z košickej katedry. Na systéme, ktorý vyvinuli pre ministerstvo spravodlivosti, je podľa neho stále čo vylepšovať, závisí totiž do značnej miery od textových zdrojov v elektronickej podobe. Softvér má urýchliť prepis dokumentov zo súdnych pojednávaní.
"Systém funguje tak, že je naučený, čiže má v sebe zakomponované matematické modely hlasu, gramatiku a text," vysvetlil Juhár. Matematické modely sú vypočítavané z reálnych nahrávok a reálnych textov. Výskumníci potrebujú obrovskú databázu. Momentálne majú už stovky hodín nahrávok a asi dve miliardy slov v textoch. Pre širšie využitie softvéru by ich potrebovali stonásobne viac.
Matematický model "sa učí" od niekoľko stoviek hovoriacich. "Máme natrénované modely pre priemerného muža a ženu," povedal Juhár. Softvér by sa však podľa neho dokázal prispôsobiť na svojho konkrétneho používateľa, ktorého hlas si nahrá. "Systém si upraví model a urobí jeho profil."
Katedra "prerazila" vo svojich rečových výskumoch už skôr. Výrazným pokrokom bolo už v rokoch 2003-2006 vytvorenie prvej praktickej aplikácie, ktorá umožňovala získavať cez telefón informácie o počasí a cestovných poriadkoch. Záujemca zavolal na určité číslo, ozval sa mu systém a v dialógu otázka-odpoveď sa pýtajúci dopracoval k informácii. Systém je v univerzitnom laboratóriu stále funkčný.
"Teší nás, že má stálu skupinu niekoľkých používateľov, sú to zrakovo postihnutí ľudia, tí si to chvália," povedal Juhár. Technici teraz pracujú na tom, aby sa mohol rozšíriť aj na smartfóny. Do výskumov zapája katedra aktívne svojich študentov. "Študent sa nemá učiť len pred tabuľou, ale v laboratóriu," zdôraznil Juhár.
Podobné softvérové produkty existujú podľa Juhára aj v angličtine. "V súčasnosti sa vyvíjajú a dostávajú aj do praktického používania produkty na národných bázach 'menšinových' jazykov - napr. v češtine, poľštine a podobne," povedal TASR Juhár. "My sme sa pustili do vývoja systému v slovenčine a úspešne v ňom napredujeme. Softvér je teda unikátny v národnom meradle," dodal.
Pokiaľ ide o patentovanie výsledkov, počas výskumu a vývoja má katedra viacero originálnych postupov. Juhár vysvetlil, že ide o matematické a softvérové postupy, ktorých patentovanie však vo všeobecnosti neumožňuje európska legislatíva.